¿Cómo Leer el PUPB?

¿Qué es el Padrón Único de Personas Beneficiarias (PUPB) de la CDMX?

El PUPB es una base de datos que integra a las personas beneficiarias de programas y acciones sociales del gobierno central y de las alcaldías de la Ciudad de México.
Dado el tamaño del archivo, 4,737,779 observaciones, resulta imposible abrirlo completamente en excel o google sheets por lo que es necesario abrirlo mediante algún tipo de software de análisis estadístico (se recomienda usar R y RStudio).
El script lectura_beneficiarios.R es un código escrito en R para leer el archivo; asimismo se agregan algunas herramientas para visualizar y hacer uso del padrón.

A continuación explicamos algunas aplicaciones básicas de R para realizar consulatas del PUPB.

Preparar el entorno en R .-

Para cargar el padrón de benficiarias a R necesitamos asignar el padrón a un objeto y cargarlo con la función read.csv.

padron<-read.csv("/.../padron_out.csv")

Donde /…/ corresponde a la ubicación del archivo en tu comptadora. Tardará un poco debido el tamaño del archivo; una vez cargado, si usas RStudio, aparecerá en el recuadro de Environment.

1.1 Entorno RStudio

Primeramente revisaremos funciones que el paquete Base de R puede correr y poseriormente consultas completas con ayuda de paquetes complementarios.

Navegando el Padrón.-

Si quieres visualizar el padrón en R puedes hacer uso de las funciones base:

View(padron) abrirá una pestaña nueva en RStudio donde podrás visualizar todo el padrón. (Requiere de mucha memoria)
head(padron,x) muestra las primeras x columnas del padrón en la terminal de R; por default despliega 10. (Poca Memoria)
tail(padron,x) muestra las últimas x columnas del padrón en la terminal de R; por default despliega 10. (Poca Memoria)
names (padron) muestra los nombres de las columnas del padrón en la terminal de R de primera a la última.

Estas funciones nos ayudan a tener un entendimiento general del padrón, sus variables y cómo se compone el mismo; no obstante, si queremos extraer información más clara del padrón, podemos hacer uso de las funciones incluídas en tidyverse.

Ejemplo con funciones base:

head(padron,5)

##   X                       id_persona  apellido_1  apellido_2       nombre edad
## 1 1 0000238327e75611c93d28c1cd9b1a95     SANCHEZ    CARRILLO ELDHER JESUS   15
## 2 2 0000238327e75611c93d28c1cd9b1a95     SANCHEZ    CARRILLO ELDHER JESUS   15
## 3 3 000027089591353055d6dd915e789c11 CASTELLANOS        VEGA     SANTIAGO    9
## 4 4 000027089591353055d6dd915e789c11 CASTELLANOS        VEGA     SANTIAGO   10
## 5 5 000027089591353055d6dd915e789c11    SANTIAGO CASTELLANOS         VEGA    9
##   sexo            alcaldia cve_alcaldia                             colonia
## 1    0            COYOACAN            3 PUEBLO PUEBLO DE SANTA URSULA COAPA
## 2    0            COYOACAN            3 PUEBLO PUEBLO DE SANTA URSULA COAPA
## 3    0 VENUSTIANO CARRANZA           17                MOCTEZUMA 1A SECCION
## 4    0 VENUSTIANO CARRANZA           17                MOCTEZUMA 1A SECCION
## 5    0 VENUSTIANO CARRANZA           17                MOCTEZUMA 1A SECCIÓN
##   monto_apoyo tipo_apoyo
## 1        1500          M
## 2        1980          M
## 3        1500          M
## 4          NA          E
## 5        3300          M
##                                                                                                                                                                                                                                                                                                                                                                               nombre_programa
## 1 APOYO A LAS FAMILIAS DE LAS ALUMNAS Y LOS ALUMNOS INSCRITOS EN EL CICLO ESCOLAR 2019-2020 EN ESCUELAS PÚBLICAS DE LA CIUDAD DE MÉXICO ANTE LA CONTIGENCIA SANITARIA POR LA PANDEMIA SARS-COV2 (COVID -19), QUE SE OTORGÓ A TRÁVES DEL VALE ELECTRÓNICO DONDE SE RECIBEN LOS APOYOS ECONÓMICOS DE LOS PROGRAMAS SOCIALES, MI BECA PARA EMEPZAR Y ÚTILES Y UNIFORMES ESCOLARES GRATUITOS 2020
## 2                                                                                                                                                                                                                                                                                                                  Programa de Becas Escolares de la Ciudad de México, "Mi Beca para Empezar"
## 3 APOYO A LAS FAMILIAS DE LAS ALUMNAS Y LOS ALUMNOS INSCRITOS EN EL CICLO ESCOLAR 2019-2020 EN ESCUELAS PÚBLICAS DE LA CIUDAD DE MÉXICO ANTE LA CONTIGENCIA SANITARIA POR LA PANDEMIA SARS-COV2 (COVID -19), QUE SE OTORGÓ A TRÁVES DEL VALE ELECTRÓNICO DONDE SE RECIBEN LOS APOYOS ECONÓMICOS DE LOS PROGRAMAS SOCIALES, MI BECA PARA EMEPZAR Y ÚTILES Y UNIFORMES ESCOLARES GRATUITOS 2020
## 4                                                                                                                                                                                                                                                                                                                                                                         Alimentos escolares
## 5                                                                                                                                                                                                                                                                                                                  Programa de Becas Escolares de la Ciudad de México, "Mi Beca para Empezar"
##    cve_programa
## 1 005_36PFEG_AS
## 2  001_36PFEG_A
## 3 005_36PFEG_AS
## 4  006_08PDDF_C
## 5  001_36PFEG_A
##                                                             dependencia
## 1 FIDEICOMISO DE EDUCACIÓN GARANTIZADA DE LA CIUDAD DE MÉXICO (FIDEGAR)
## 2 Fideicomiso de Educación Garantizada de la Ciudad de México (FIDEGAR)
## 3 FIDEICOMISO DE EDUCACIÓN GARANTIZADA DE LA CIUDAD DE MÉXICO (FIDEGAR)
## 4                     Sistema para el Desarrollo Integral de la Familia
## 5 Fideicomiso de Educación Garantizada de la Ciudad de México (FIDEGAR)
##   cve_dependencia tipo_persona tipo_beneficiario tipo_programa
## 1          36PFEG            1                 1             0
## 2          36PFEG            1                 1             1
## 3          36PFEG            1                 1             0
## 4          08PDDF            1                 1             1
## 5          36PFEG            1                 1             1

tail(padron) #Por default se visualizan 10 observaciones

##               X                       id_persona apellido_1 apellido_2
## 2390865 2390865 f5e05d032ad51a2481ccb5be089f1eed  HERNANDEZ     FLORES
## 2390866 2390866 faeafdcfe1f24b01b28cdea0038d2f31      GOMEZ   BARRANCO
## 2390867 2390867 fbf7b7642844ab18ee354bf8f78f6783     TELLEZ    CORNEJO
## 2390868 2390868 fe063a5c1795af9ee46df43783426469 ANA TERESA     PATIÑO
## 2390869 2390869 ff6d7cc59819704e9e8f38b45913102f    PADILLA    TRUJANO
## 2390870 2390870 ffb172abfe52ced4793e005d49ba3527      AYALA    JIMENEZ
##                 nombre edad sexo   alcaldia cve_alcaldia
## 2390865    REYNA ERIKA   39    1 IZTAPALAPA            7
## 2390866          LAURA   43    1   COYOACAN            3
## 2390867 LUCIA FERNANDA   22    1 IZTAPALAPA            7
## 2390868          ZARCO   29    1  IZTACALCO            6
## 2390869      MONSERRAT   30    1  IZTACALCO            6
## 2390870  BLANCA ESTELA   48    1    TLAHUAC           11
##                           colonia monto_apoyo tipo_apoyo
## 2390865          LEYES DE REVORMA        4825          M
## 2390866 PEDREGAL DE SANTO DOMINGO        3535          M
## 2390867       SAN MIGUEL TEOTONGO        4555          M
## 2390868         AGRICOLA ORIENTAL        4680          M
## 2390869         AGRICOLA ORIENTAL        4825          M
## 2390870       SAN NICOLAS TETELCO        4825          M
##                  nombre_programa cve_programa
## 2390865 Comedores populares 2021 004_08PDDF_C
## 2390866 Comedores populares 2021 004_08PDDF_C
## 2390867 Comedores populares 2021 004_08PDDF_C
## 2390868 Comedores populares 2021 004_08PDDF_C
## 2390869 Comedores populares 2021 004_08PDDF_C
## 2390870 Comedores populares 2021 004_08PDDF_C
##                                               dependencia cve_dependencia
## 2390865 Sistema para el Desarrollo Integral de la Familia          08PDDF
## 2390866 Sistema para el Desarrollo Integral de la Familia          08PDDF
## 2390867 Sistema para el Desarrollo Integral de la Familia          08PDDF
## 2390868 Sistema para el Desarrollo Integral de la Familia          08PDDF
## 2390869 Sistema para el Desarrollo Integral de la Familia          08PDDF
## 2390870 Sistema para el Desarrollo Integral de la Familia          08PDDF
##         tipo_persona tipo_beneficiario tipo_programa
## 2390865            0                 0             1
## 2390866            0                 0             1
## 2390867            0                 0             1
## 2390868            0                 0             1
## 2390869            0                 0             1
## 2390870            0                 0             1

Como podemos observar la información del Padrón es muy grande, incluso para las consultas relativamente simples, por lo que puede presentar un problema para su visualización. Es por ello que recomendamos el uso de tidyverse para hacer consultas de manera más ordenada y obtener información importante del padrón.

Consultas de Información con tidyverse .-

El script a continuación requiere de la librería tidyverse: una colección de paquetes con funciones en R para el manejo de Bases de Datos. El código que trataremos a continuación requiere a R descargar y habilitar este paquete, ésto se logra con la función:

require(tidyverse)

Las funciones de tidyverse nos permiten extraer más información de manera eficiente de las bases de datos.

Como ejemplo la función glimpse incluída en tidyverse, a comparación de names en el paquete base, no solamente nos proporciona los nombres de las columnas, sino el tipo de dato en cada columna.

names(padron) #Paquete Base

##  [1] "X"                 "id_persona"        "apellido_1"       
##  [4] "apellido_2"        "nombre"            "edad"             
##  [7] "sexo"              "alcaldia"          "cve_alcaldia"     
## [10] "colonia"           "monto_apoyo"       "tipo_apoyo"       
## [13] "nombre_programa"   "cve_programa"      "dependencia"      
## [16] "cve_dependencia"   "tipo_persona"      "tipo_beneficiario"
## [19] "tipo_programa"

glimpse(padron) #tidyverse

## Rows: 2,390,870
## Columns: 19
## $ X                 <int> 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 1…
## $ id_persona        <chr> "0000238327e75611c93d28c1cd9b1a95", "0000238327e7561…
## $ apellido_1        <chr> "SANCHEZ", "SANCHEZ", "CASTELLANOS", "CASTELLANOS", …
## $ apellido_2        <chr> "CARRILLO", "CARRILLO", "VEGA", "VEGA", "CASTELLANOS…
## $ nombre            <chr> "ELDHER JESUS", "ELDHER JESUS", "SANTIAGO", "SANTIAG…
## $ edad              <int> 15, 15, 9, 10, 9, 9, 12, 13, 12, 12, 15, 15, 15, 15,…
## $ sexo              <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ alcaldia          <chr> "COYOACAN", "COYOACAN", "VENUSTIANO CARRANZA", "VENU…
## $ cve_alcaldia      <int> 3, 3, 17, 17, 17, 17, 5, 5, 5, 5, 6, 6, 6, 7, 7, 8, …
## $ colonia           <chr> "PUEBLO PUEBLO DE SANTA URSULA COAPA", "PUEBLO PUEBL…
## $ monto_apoyo       <dbl> 1500, 1980, 1500, NA, 3300, 820, 1500, NA, 2310, 820…
## $ tipo_apoyo        <chr> "M", "M", "M", "E", "M", "M", "M", "E", "M", "M", "M…
## $ nombre_programa   <chr> "APOYO A LAS FAMILIAS DE LAS ALUMNAS Y LOS ALUMNOS I…
## $ cve_programa      <chr> "005_36PFEG_AS", "001_36PFEG_A", "005_36PFEG_AS", "0…
## $ dependencia       <chr> "FIDEICOMISO DE EDUCACIÓN GARANTIZADA DE LA CIUDAD D…
## $ cve_dependencia   <chr> "36PFEG", "36PFEG", "36PFEG", "08PDDF", "36PFEG", "0…
## $ tipo_persona      <int> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1…
## $ tipo_beneficiario <int> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1…
## $ tipo_programa     <int> 0, 1, 0, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 0, 1, 0, 1, 1…

Algunas de funciones más útiles para ver y manejar la información de bases grandes como el padrón dentro de tidyverse son las siguientes:

table().- selecciona una columna regresa un objeto (tibble) con las observaciones únicas de esa columna y el número de veces que aparecen en el data.frame.
select().- selecciona las columnas que quieres ver o sobre las cuales operar en lugar de toda la base.
filter().- selecciona un filtro lógico para ver u operar sobre la base.
group_(), group_split().- agrupa la información de la tabla de acuerdo a los grupos de variables que tenga una columna.
summarise().- hace uso de la información de una o más columnas seleccionadas y crea una nueva columna con la información deseada.

Para más información sobre las funciones y distintos usos de tidyverse consuylta en su página aquí.

El poder de tidyverse es la capacidad de combinar este tipo de funciones haciendo uso del operaror pipe: %>% para hacer análisis de data frames grandes información.

Ejemplo.- Beneficiarios en Benito Juarez

A continuación se presenta un ejemplo comentado con estas funciones para analizar ver los grupos de hombres beneficiados en la alcaldía Benito Juarez por programas sociales y la suma acumulada del dinero en transferencias monetarias.

Con table podemos ver qué tipo de apoyos existen, vemos que está codificado en uno o dos caracteres, por lo que tenemos que consultar el diccionario de datos para localizar cuál es la letra que corresponde a transferencias monetarias.

En este caso la letra M corresponde a transferencias únicamente monetarias.

table(padron$tipo_apoyo) #Vemos los tipos de apoyo que existen; de acuerdo al diccionario de datos M se refiere a transferencias monetarias

## 
##       E       M      MS       S 
##  350680 2022252   17920      18

Haciendo uso de select filtramos las columnas que utilizaremos; esto optimiza los procesos posteriores del análisis. Finalmente vemos los filtros que necesitamos; hay que recordar que los filtros se aplican de manera secuencial por lo que el filtro se aplica de la siguiente manera:

sexo == 0, caracteriza a los hombres de acuerdo al diccionario.
alcaldia == BENITO JUAREZ, nos da aquellas obaservaciones dentro de la alcaldía.
tipo_de_apoyo == M, selecciona las trasnferencias monetarias de acuerdo al diccionario.
tipo_programa == 1, selecciona a los programas, no acciones sociales, dentro del padrón.

padron %>%  select(sexo,tipo_apoyo,tipo_programa,cve_alcaldia,monto_apoyo,alcaldia) %>% 
  filter(sexo==0 & alcaldia=="BENITO JUAREZ" & tipo_apoyo=="M" &  tipo_programa==1) %>% 
  head()

##   sexo tipo_apoyo tipo_programa cve_alcaldia monto_apoyo      alcaldia
## 1    0          M             1           14        3300 BENITO JUAREZ
## 2    0          M             1           14         820 BENITO JUAREZ
## 3    0          M             1           14        3300 BENITO JUAREZ
## 4    0          M             1           14         820 BENITO JUAREZ
## 5    0          M             1           14        1200 BENITO JUAREZ
## 6    0          M             1           14         720 BENITO JUAREZ

Finalmente, a esta tabla filtrada, aplicamos summarise para desplegar la suma de la columna monto_de_apoyo, removiendo aquellas columnas que puedan estar incompletas, para obtener el el monto total de programas sociales en transferencias monetarias para Benito Juarez.

padron %>%  select(sexo,tipo_apoyo,tipo_programa,cve_alcaldia,monto_apoyo,alcaldia) %>% 
  filter(sexo==0 & alcaldia=="BENITO JUAREZ" & tipo_apoyo=="M" &  tipo_programa==1) %>%  
  summarise(sum(monto_apoyo,na.rm = T))

##   sum(monto_apoyo, na.rm = T)
## 1                    35645350

Incluímos el código en el script lectura_beneficiarios.R para este ejemplo en expecífico y alentamos a los usuarios realizar consultas del padrón haciendo uso de R para cualquier investigación con bases grandes, no sólamente el PUDB.

Conseguir Beneficiarias Únicas.-

Un último ejemplo que puede ser de interés es el conseguir a los beneficiarias únicas de programas de la ciudad.

Por la naturaleza misma de estos programas y acciones sociales, una persona puede recibir más de un apoyo o beneficio siempre y cuando así se establezca en las reglas de operación. Entre ellas generar un subset de la base del padrón con los beneficiarias únicas. Es decir con las personas que reciben al menos un apoyo o beneficio de algún programa o acción social.

# Generar beneficiarios unicos:
BeneficiariosUnicos <- padron %>% group_by(id_persona,
                                           apellido_1,
                                           apellido_2,
                                           nombre,
                                           tipo_persona) %>% 
  summarise(Edad=round(mean(edad,na.rm = T),0),
            Registros=n())

Incluimos esta función en el script lectura_beneficiarios.R.

¡La transparencia y rendición de cuentas es labor de todos!