Como al principio de todo script, recomiendo reiniciar R. Esto lo conseguimos con Session > Restart R y clickeando en la escoba del panel de “Environment” (superior derecho).
library(tidyverse)
## -- Attaching packages -------------------------- tidyverse 1.3.0 --
## v ggplot2 3.3.2 v purrr 0.3.4
## v tibble 3.0.3 v dplyr 1.0.2
## v tidyr 1.1.2 v stringr 1.4.0
## v readr 1.3.1 v forcats 0.5.0
## -- Conflicts ----------------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
En el ejercicio trabajaremos con un panel de datos de países latinoamericanos en este milenio. Tenemos información sobre gasto en burocracia y pobreza; buscaremos responder a las preguntas (c) y (d).
Los siguientes son los datos de gasto en burocracia, 2000-2017, que tienen por fuente el Banco Mundial (2017), compilados por Our World in Data:
# (este no es el formato original de OWID, aunque se parece bastante)
df_gasto_burocracia <- read_csv("datos/gasto_burocracia.csv")
## Parsed with column specification:
## cols(
## PAÍS = col_character(),
## AÑO = col_double(),
## `% DE BUROCRACIA EN GASTO FISCAL` = col_double()
## )
df_gasto_burocracia
## # A tibble: 216 x 3
## PAÍS AÑO `% DE BUROCRACIA EN GASTO FISCAL`
## <chr> <dbl> <dbl>
## 1 Argentina 2000 14.7
## 2 Argentina 2001 14.2
## 3 Argentina 2002 11.3
## 4 Argentina 2003 11.7
## 5 Argentina 2004 11.5
## 6 Argentina 2005 NA
## 7 Argentina 2006 NA
## 8 Argentina 2007 NA
## 9 Argentina 2008 NA
## 10 Argentina 2009 NA
## # ... with 206 more rows
Estos son los datos de (extrema) pobreza, 2001-2017, medida como el porcentaje de la población que vive con menos de USD 1.90 al día (Banco Mundial, 2019):
# (este no es el formato original del Banco Mundial, aunque se parece bastante)
df_pobreza <- read_csv("datos/pobreza.csv")
## Parsed with column specification:
## cols(
## country = col_character(),
## `2001` = col_double(),
## `2002` = col_double(),
## `2003` = col_double(),
## `2004` = col_double(),
## `2005` = col_double(),
## `2006` = col_double(),
## `2007` = col_double(),
## `2008` = col_double(),
## `2009` = col_double(),
## `2010` = col_double(),
## `2011` = col_double(),
## `2012` = col_double(),
## `2013` = col_double(),
## `2014` = col_double(),
## `2015` = col_double(),
## `2016` = col_double(),
## `2017` = col_double()
## )
df_pobreza
## # A tibble: 12 x 18
## country `2001` `2002` `2003` `2004` `2005` `2006` `2007` `2008` `2009` `2010`
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Argent~ 9.4 14 7 5.4 3.9 3.3 2.9 2.6 2.6 1.1
## 2 Bolivia 22.8 24.7 NA 13.7 19.3 16.4 12.4 11.1 10.5 NA
## 3 Brazil 11.6 10.3 11.1 9.7 8.6 7.2 6.8 5.6 5.4 NA
## 4 Chile NA NA 4.2 NA NA 2.4 NA NA 2.6 NA
## 5 Colomb~ 19.7 14.3 12 10.9 9.7 NA NA 10.4 8.9 7.7
## 6 Ecuador NA NA 14.5 15 12.1 8.1 8.5 7.5 7.2 5.6
## 7 Guyana NA NA NA NA NA NA NA NA NA NA
## 8 Peru 17.2 15 11.7 13.5 15.3 13.3 11 9 7 5.5
## 9 Paragu~ 8.9 13.2 8.3 5.7 6.1 7.9 7.8 4.3 5.8 5.5
## 10 Surina~ NA NA NA NA NA NA NA NA NA NA
## 11 Uruguay NA NA NA NA NA 0.5 0.3 0.2 0.2 0.1
## 12 Venezu~ 11 18.2 22.7 19.8 18.9 10.2 NA NA NA NA
## # ... with 7 more variables: `2011` <dbl>, `2012` <dbl>, `2013` <dbl>,
## # `2014` <dbl>, `2015` <dbl>, `2016` <dbl>, `2017` <dbl>
Modificación A
Modificación B
Etc.