El paquete MicroDatosEs está pensado para automatizar la lectura de ficheros de microdatos producidos por organismos estadísticos españoles (el INE y demás).
Consta de dos partes: una estructura genérica para permitir la lectura de cualquier fichero de microdatos y conjuntos de ficheros de metadatos que, utilizando la estructura genérica, permiten leer ficheros concretos de microdatos.
EPAwebT0112
con un contenido prácticamente ininteligible. Haciendo
library(MicroDatosEs) epa <- epa2005("EPAwebT0112")
data.set
, una estructura de datos similar a un dataframe
definido en el paquete memisc
y que dispone de ciertos instrumentos y estructuras de datos que lo hacen muy adecuado para trabajar con información procedente de encuestas. De hecho, quien quiera usar R en este ámbito, haría bien en, cuando menos, familiarizarse con la viñeta del paquete.
Para inspeccionar el contenido del objeto epa
se puede hacer summary(epa)
y luego seleccionar las variables de interés mediante
dat <- subset( epa, select = c( edad, sexo, nforma, aoi, factorel) )
dat <- as.data.frame(dat)
data.set
en un dataframe
tradicional.
Por ejemplo, si ahora se hace
tasa.paro <- dat[ as.numeric(dat$edad) > 3, ] # se eliminan los menores de 16 años tasa.paro <- tasa.paro[ tasa.paro$aoi != "i", ] # se eliminan los inactivos tasa.paro$factorel <- tasa.paro$factorel / 100 # realmente no necesario 100 * sum( tasa.paro$factorel * (tasa.paro$aoi == "p") ) / sum( tasa.paro$factorel )
La página de desarrollo de MicroDatosEs está aquí. Contiene el código del paquete y la última versión de desarrollo del mismo.