Cómputos 2012: casillas inconsistentes

Uno de los hechos que causa agravio a la Coalición Movimiento Progresista son las inconsistencias en las actas de escrutinio y cómputo (ver págs. 67-78 del recurso de inconformidad con la elección presidencial).

La ley señala que las actas con inconsistencias aritméticas evidentes deben ser recontadas. Por esta y otras razones, 77,712 paquetes para presidente, 80,633 para diputados y 81,418 para senadores fueron recontados durante los cómputos distritales del IFE.

A pesar de los recuentos numerosos, en muchas casillas los resultados para presidente difieren de los resultados para diputados o senadores. Según el recurso de inconformidad  de la coalición, estas anomalías resta certeza al proceso electoral. Al tratarse de tres elecciones distintas, las diferencias entre actas de una elección y otra no son causal de recuento ni de nulidad de tales casillas. Si bien estas diferencias no necesariamente son una anomalía en términos legales, ¿qué dicen al respecto los datos a nivel casilla del cómputo distrital del IFE?

¿Cuál es la magnitud de las diferencias? El primer paso es analizar la estadística descriptiva de los resultados a nivel casilla para las tres elecciones. El voto para cierto partido puede diferir entre la elección presidencial y las legislativas porque existe el voto dividido: hay quien votó por AMLO o EPN para presidente pero lo hizo por otro partido para diputados o senadores. Por lo tanto, es mejor  concentrarnos en las diferencias en el voto total registrado en las 3 diferentes actas de escrutinio.

Los resultados de casillas especiales son los que muestran mayores diferencias puesto que, dependiendo de dónde se encuentre el votante, tendrá derecho a votar sólo para presidente, o para presidente y legisladores MR o RP. Por lo tanto vale la pena excluir de este análisis las 902 casillas especiales. Lo mismo ocurre con las 305 actas de voto para mexicanos en el extranjero puesto que en ellas sólo hay votas para presidente. Omitiendo estas casillas, nos quedamos con 142230 casillas que son estrictamente comparables.

Elecciones México 2012
Resultados a nivel casilla para presidente, diputados y senadores
Elección Rubro Media Desv. est. Percentil 25 Mediana Percentil 75
Voto Total Presidente 349.43 95.14 294 358 414
Voto Total Diputados 349.47 95.41 294 358 414
Voto Total Senadores 349.40 95.71 294 358 414
VTpte – Vtdip Pte – Dip -0.04 16.48 0 0 0
VTpte – Vtsen Pte – Sen 0.03 17.90 0 0 0
VTdip – Vtsen Dip – Sen 0.07 19.26 0 0 0
PAN Presidente 88.64 54.63 48 79 119
PAN Diputados 90.48 56.71 48 82 123
PAN Senadores 91.83 56.56 49 84 124
PRI Presidente 101.48 41.97 72 97 124
PRI Diputados 104.39 44.74 72 100 131
PRI Senadores 103.61 44.52 72 99 129
PRD Presidente 67.40 43.32 34 60 94
PRD Diputados 57.52 44.72 23 45 83
PRD Senadores 58.11 44.45 24 46 84
Nulos Presidente 8.67 6.61 5 8 11
Nulos Diputados 17.33 11.57 10 15 23
Nulos Senadores 19.98 12.48 11 18 27
Número de casillas: 142230 (no se incluyen casillas especiales ni voto en el extranjero).

El voto total promedio en las casillas para presidente fue de 349.43, para diputados fue de 349.47 y para senadores de 349.40. Es decir que, en promedio, las actas registran 0.04 más votos para diputados que para presidente. Por otro lado, las actas registran 0.03 más votos para presidente que para senadores. Es decir que, en agregado, las diferencias entre votos totales para presidente y legisladores fluctúan entre -5689 y 4266 votos. Es decir que, viéndolas como promedio o como agregado, se trata de diferencias mínimas.

Estos diagramas de dispersión comparan el voto total de cada casilla en las tres elecciones. La R de Pearson entre VTpresidente y VTdiputados es de 0.985, y entre VTpresidente y VTsenado es de 0.982. Los puntos que se alejan de la recta de 45 grados denotan casillas con diferencias entre una u otra elección.

¿Qué tan frecuentes son estas diferencias? De las 142230 casillas, 87720 (61.6%) registran el mismo número de votos totales para presidente que para diputados y 54510 (38.4%) registran un dato distinto entre ambas elecciones. De éstas, 26774 casillas registran menos votos para presidente que diputados (diferencia negativa), mientras que 27736 registran más votos para presidente que para diputados (diferencia positiva).

¿Cómo se distribuyen estas diferencias? Si estas diferencias son dolosas, podríamos esperar que ocurrieran con mayor frecuencia en casillas ganadas por ciertos candidatos. Por otro lado, si se trata de errores humanos en el escrutinio o llenado o captura de las actas, podríamos esperar que ocurrieran con la misma frecuencia relativa en las casillas de cualquier “color”.

Por sencillez, clasifiqué las casillas con diferencias en votos totales entre aquellas que van de 1 a 5 votos (positivos o negativos), y aquellas que son mayores a 5 votos (de nuevo, positivos o negativos).

La siguiente gráfica ilustra la distribución de las casillas con diferencias en votos totales para presidente y diputados, distinguiendo entre el candidato ganador en cada casilla (es decir, esta gráfica ilustra los porcentajes de una tabla cruzada 5 x 3). Como se aprecia, la distribución de diferencias positivas y negativas es relativamente simétrica para los tres tipos de casillas. Viendo a mayor detalle, las casillas ganadas por AMLO tienen una mayor  proporción de diferencias que las ganadas por EPN o JVM.

Aquí encontrarán la estadística descriptiva y las tablas cruzadas comentadas en esta nota.

En resumen: 38% de las casillas registran un voto total distinto entre presidente y diputados (30% entre presidente y senadores). Estas diferencias pueden deberse a errores en el escrutinio de los votos, en el llenado de las actas (hay un acta para cada elección), o bien en la captura de las mismas. El escrutinio puede ser fidedigno pero si un votante “se lleva” su boleta o si la deposita en otra casilla, habrá diferencias entre las 3 actas. En promedio, las diferencias son pequeñas: entre -0.4 y 0.3 votos. Pero existen alrededor de 8% de casillas con +/- 5 votos de diferencia. Sin embargo, la distribución de las casillas con diferencias no muestra un sesgo favorable a EPN.

Materiales relacionados:

  • ¿Por qué hubo tantos errores e inconsistencias en las actas de 2006? — powerpoint / pdf 13/ago2006.
  • Errores aritméticos en actas: análisis comparativo para 2000, 2003 y 2006 — powerpoint / pdf 24/ago/06.

Topes de gasto de campaña 2012

Estos son los topes máximos de gasto de campaña para la elección federal 2012.

  • De acuerdo al COFIPE (art. 229), el tope para presidente sera equivalente al 20% del financiamiento público de campaña establecido para todos los partidos en el año de la elección”: 336mdp.
  • El tope para diputados será igual al tope para presidente dividido entre 300: 1.12mdp.
  • El tope para senadores será proporcional al número de distritos de cada entidad pero hasta un máximo de 20 distritos (lo cual afecta al DF, Veracruz y Edomex que tienen 27, 21 y 40 distritos, respectivamente). En promedio será de 9.5 mdp.
  • Si multiplicamos el tope para diputados por 300, el tope promedio para senadores por 32, y lo sumamos al tope presidencial, obtendremos el gasto máximo de campaña en que puede incurrir un partido o coalición en este proceso electoral: 976 millones de pesos.
Tope de gasto de campaña para: Candidatos Total
Diputado federal $1,120,373.61 300 $336,112,083.00
Senador (promedio) $9,523,175.72 32 $304,741,622.99
Presidente $336,112,084.16 1 $336,112,084.16
Tope de gasto máximo por partido o coalición: $976,965,790.15

Participación electoral 2012

La votación total en la más reciente elección presidencial fue de 50,323,153, lo que representa el 63.34% de la lista nominal. La participación promedio en todas las casillas, un indicador algo distinto, fue de 61.34%.

1. La participación electoral tiene una variación importante entre una entidad y otra (between state variation), y al interior de cada estado (within state variation). Estos histogramas ilustran la distribución de la participación electoral a nivel casilla en cada entidad:

¿Cómo explicar la variación entre entidades? Dos factores observables pueden ayudar a explicar estas diferencias: el partido en el gobierno y las elecciones coincidentes. Continue reading

El swing de 2012

Estos son los triplots a nivel casilla de la elección presidencial de 2012 y 2006. Observe de cerca lo que ocurre entre uno y otro y discuta.

¿Cómo se interpreta un triplot?

Si consideramos solamente la suma de votos obtenidos por EPN, AMLO y JVM, y calculamos los porcentajes respectivos, podemos utilizar una gráfica triangular (triplot) para ilustrar el resultado de cada casilla. La gráfica tiene dos páneles, uno para casillas urbanas y otro para no urbanas. Cada punto en el triángulo ilustra la proporción de votos de EPN, AMLO y JVM en una casilla (normalizadas para que sumen 100%). El color de cada punto denota el candidato ganador en esa casilla. El eje horizontal mide el porcentaje de EPN, la diagonal izquierda el de AMLO y la derecha el de JVM. De este modo los puntos cercanos a la “Y” que se dibuja en el centro del triángulo indican casillas donde la competencia fue más reñida, mientras que casillas cercanas a los vértices del triángulo denotan casillas cargadas hacia uno de los candidatos.

Como se aprecia, las casillas no urbanas tienen una alta proporción de casillas sobrecargadas hacia Peña. Por otro lado, en casillas urbanas hubo mucho más casillas reñidas entre EPN y AMLO (ver brazo izquierdo de la “Y”) que entre EPN y JVM.

En 2012 se aprecia que la mayor competencia ocurrió en la región derecha del triángulo de casillas urbanas, es decir, entre AMLO y Calderón. Si observas con cuidado, entre 2006 y 2012, la “nube de casillas” se desplazó de la derecha a la izquierda del trángulo, indicando un fuerte cambio de preferencias hacia el PRI o su candidato. Este es el swing de 2012.

 

Elecciones presidenciales 1994-2012: ¿ciclo electoral?

Como sabemos, el margen de victoria entre dos punteros no cuentan toda la historia de una elección multipartidista. Si consideramos solamente la suma de votos obtenidos por los tres principales candidatos (PRI, PAN y PRD), y calculamos los porcentajes respectivos, podemos utilizar una gráfica triangular (triplot) para ilustrar en dos dimensiones el resultado de una elección de tres candidatos.

Cada punto en el triángulo ilustra la proporción de votos obtenida por el candidato(a) del PAN, PRI y PRD en  las 4 elecciones presidenciales más recientes (1994 – 2012). Los porcentajes de votos de la gráfica difieren de los resultados oficiales porque han sido normalizadas para que sumen 100%, es decir, ignoran los porcentajes de otros candidatos, nulos o no registrados.

El eje horizontal mide el porcentaje de votos del PRI, la diagonal izquierda el del PRD y la derecha el de PAN. De este modo los puntos cercanos a la “Y” en el centro del triángulo indican elecciones reñidas, mientras que cualquier punto cercano a los vértices del triángulo denotan elecciones cargadas hacia uno de los candidatos. La “Y” separa 3 posibles regiones ganadoras: PRD arriba, PRI hacia la izquierda y PAN hacia la derecha.

Como se aprecia, 1994 fue una elección dominada por el PRI, luego tuvimos dos elecciones donde las preferencias se acercaron más al PAN, en 2006 casi cruzamos a la zona del PRD, y en 2012 tuvimos un “retorno hacia el PRI”. Los movimientos laterales entre una elección y otra se les conoce en la literatura como swing. El patrón de las 4 elecciones presidenciales parece dibujar una especie de ciclo electoral propio de elecciones bajo regla de mayoría. En 6 años veremos si se “cierra el círculo” o nos movemos a otra región menos explorada del triángulo.

Estos son los datos que usé como base para calcular las proporciones de la gráfica (todos provienen de cómputos distritales del IFE):

Suma de votos de los 3 principales candidatos presidenciales
Año PAN PRI PRD Total
1994 9,146,841 17,181,651 5,852,134 32,180,626
2000 15,989,636 13,579,718 6,256,780 35,826,134
2006 14,916,927 9,237,000 14,683,096 38,837,023
2012 12,786,647 19,226,784 15,896,999 47,910,430
Proporción de votos entre los 3 principales candidatos presidenciales
Año PAN PRI PRD Total
1994 28.42% 53.39% 18.19% 100%
2000 44.63% 37.90% 17.46% 100%
2006 38.41% 23.78% 37.81% 100%
2012 26.69% 40.13% 33.18% 100%
* los porcentajes sólo incluyen los votos de los 3 candidatos principales.

Lecciones del resultado electoral

Los amigos de Animal Político me invitaron a escribir unas líneas sobre:

¿Qué lecciones hay en los resultados electorales por casilla y entidad?

Las bases de datos a nivel casilla del PREP y cómputos distritales del IFE nos permiten hacer una primera radiografía del resultado de la elección presidencial 2012. En este blog invitado comentaré algunos resultados estadísticos que pueden ayudarnos a comprender mejor las claves del éxito o fracaso de cada uno de los candidatos presidenciales.

Aquí pueden leer el resto de la nota. Aquí mis conclusiones:

Varias lecciones surgen del análisis anterior. Para concluir destaco sólo dos. La primera es una lección importante para cualquier candidato presidencial: la elección fue mucho más reñida de lo que aparenta en las casillas urbanas que, al representar casi dos tercios de las casillas del país, prácticamente garantizan el triunfo al candidato que gane en ellas. Baste recordar que tanto Peña hoy como Calderón en 2006 ganaron por márgenes similares en casillas urbanas. La segunda es quizá más importante para futuros candidatos de izquierda: para ganar en las zonas urbanas del país no basta con arrasar en una o dos entidades. En 2006 AMLO ganó holgadamente en el DF, Edomex y en las casillas rurales y no bastó. En 2012 volvió a arrasar en la capital y dio una buena batalla en Edomex. Pero no fue suficiente porque se topó con el bajío y un resucitado voto rural priísta. El centro político-electoral del país no está en el “centro”.

Cómputos 2012: resultados por tipo de casilla

Circula en redes sociales una nueva mentira sobre la elección 2012 (bajo otras condiciones diría que es un malentendido o confusión pero según el sapo es la piedra). Según esta nota de Jorge A. González y Jorge A. López Gallardo (doctor en física y profesor de la Univ. de Texas en El Paso), y esta otra donde citan la primera, las casillas especiales son una muestra representativa del país porque “estuvieron distribuidas a lo largo y ancho del país, y en ellas votaron tanto habitantes de zonas urbanas como rurales”, y no sólo eso, son una “súper encuesta cuyos resultados son extremadamente confiables en términos estadísticos”.

Y como AMLO ganó en las casillas especiales, la lógica indica que AMLO debió haber ganado en el resto del país. Y como los cómputos deI IFE dicen lo contrario, cómo dudarlo, ¡ésta puede ser una evidencia más del fraude!

Todo lo anterior es falso por una razón muy sencilla: la premisa inicial es falsa. Las casillas especiales NO son una muestra representativa del país por varias razones: 1. El número y ubicación de las casillas especiales es determinado por cada consejo distrital (es decir, no son aleatorias). 2. Al ubicarse en puntos de alto tránsito, son predominantemente urbanas. 3. Los ciudadanos dispuestos a formarse varias horas para votar en una casilla especial tampoco son representativos del votante mexicano típico.

Va la demostración con 3 sencillas gráficas de pastelito.

1. En el país se instalaron 143,437 casillas, 64% de ellas en zonas urbanas y 36% en zonas no urbanas. Sin embargo, 82% de las casillas especiales son urbanas. Por lo tanto son un muestra sesgada y no representativa del país.

2. En las casillas ordinarias (142,535) EPN obtuvo la mayoría de votos. En las 902 casillas especiales, AMLO obtuvo más votos que EPN pero esto no implica que haya ganado en el resto del país ni que hubo ningún tipo de fraude.

3. Si comparamos los resultados de casillas urbanas vs. no urbanas veremos que EPN tuvo más votos en ambos tipos de casillas. Sin embargo, la ventaja de EPN sobre AMLO es más holgada en las casillas no urbanas (43.4%  vs. 26.7%)  que en las urbanas (35.59% vs. 34.02%). Esto implica que las casillas especiales ni siquiera son representativas de las casillas urbanas.

Conclusión: las casillas especiales, donde AMLO ganó, no son representativas de las preferencias de todo el país. Las casillas urbanas, donde EPN ganó por escaso margen, tampoco lo son. Las casillas para recibir el voto de mexicanos en el extranjero, donde JVM ganó, tampoco lo son. ¿Saben qué cosa sí lo era? El conteo rápido del IFE, mismo que anticipó los resultados del PREP y del cómputo distrital.

¿Qué opinaba López Gallardo del PREP? Que tenía un algoritmo trampso porque había una R de Pearson sospechosamente alta. Eso también era falso y lo dijimos aquí.

¿Por qué ganó AMLO en casillas especiales y JVM en el voto desde el extranjero? Buenas preguntas para su politólogo o sociólogo de confianza. Yo tengo mis teorías al respecto pero ese no es el punto de esta entrada.

(¿Déjà vu? En 2006 se decía una falacia similar a la anterior sobre las actas con inconsistencias que habían quedado fuera del PREP, que eran predominantemente rurales, y donde AMLO derrotaba a Calderón.)

Voto nulo y coaliciones 2012

En distritos en que no hubo coalición legislativa PRI-PVEM, cruzar el logotipo de ambos partidos era voto nulo puesto que implicaba un voto por dos candidatos distintos. En 101 distritos de mayoría relativa no hubo tal coalición, y en otro tanto de estados no la hubo para senadores.

¿Adivinen qué pasó? El voto nulo promedio para Diputados en los 101 distritos SIN coalición PRI-PVEM fue 7.8%, mientras que en los 199 distritos CON coalición fue de 3.6%. Por lo tanto, es posible que PRI haya perdido algunos diputados por “votos nulos no intencionales” y no tanto por un sofisticado “voto diferenciado“. File in: unintended consequences.

VotonuloDIPxCoalicion VotonuloSENxCoalicion

Resultados por distrito y tipo de casilla

Este domingo el Consejo General del IFE reportó el cómputo distrital para la elección presidencial de México en 2012. Como vimos ya, este coincide en gran medida con los resultados del PREP.

Muchos se clavan en las texturas de “por qué llegan primero unas casillas que otras” (porque la geografía y la distancia importa) y/o por qué el flujo de datos del PREP no es 100% aleatorio (porque hay factores sistemáticos y preferencias políticas regionales que lo afectan), cuando lo realmente importante es analizar con cuidado los resultados a nivel distrito y casilla.

En esta entrada les comparto el excelente análisis de Fernando Pérez Cervantes (@EulerEquation), candidato a Doctor en Economía por la Universidad de Chicago.

  • Mapa de resultados de la elección presidencial a nivel distrital (con base en datos del PREP 2012 del IFE). Aquí una versión interactiva del mismo mapa.
  • Histogramas de resultados a nivel casilla en casillas urbanas y no urbanas para EPN, AMLO y JVM, así como votos totales.

Las gráficas se explican por sí mismas, creo.

¿Qué es eso de un histograma y cómo se lee? Un histograma ilustra la distribución de frecuencias de una variable o conjunto de datos. En este caso, en el eje horizontal se encuentra el total de votos o bien el voto de cada candidato, mientras que en el eje vertical relfeja el número de casillas para cada nivel de votación. Los histogramas ilustran tanto la tendencia central o promedio de una variable (fíjate en “el pico de la gráfica”), como la dispersión o varianza de la misma (fíjate en que tan “aplanada o picuda” es la gráfica). Por último, el histograma también refleja si una distribución es simétrica (como una campana) o sesgada (con una cola más delgada que otra). Enjoy!

Votos dobles y triples

Los votos por dos o tres partidos han causado mucha confusión en este proceso electoral. Por principio de cuentas, resultaron en que hubo 12 formas distintas de votar por 4 candidatos a presidente y algo similar ocurrió para diputados y senadores. Por fortuna, la gran mayoría de los votantes se apegaron a la estrategia más sencilla: marcar un sólo cuadrito y ya.

Según el cómputo distrital, 15.1% de los votos para presidente marcaron emblemas de 2 o más partidos: 7.36% votaron por EPN marcando PRI-PVEM, y 5.94% votaron por AMLO marcando PRD-PT-MC, y 1.8% usaron alguna de las tres combinaciones PRD-PT, PT-MC o PRD-MC. ¿Confundidos? Yo también.

¿Qué pasa con esos votos? ¿Implican anular el voto como nos enseñaron todos los cofipes anteriores? No. ¿Se contarán doble? No. ¿Cómo se repartirán? Se prorratean en partes iguales.

Los votos por 2 o 3 partidos que presentan a un mismo candidato en coalición se contabilizan por separado en cada acta de casilla y cuentan como 1 sólo voto para dicho candidato. Hasta aquí no hay problema.

Para el cómputo distrital de diputados de representación proporcional (RP), los votos se distribuyen a partes iguales entre los dos o tres partidos coaligados. Si al hacer la división sobra 1 o 2 votos, se van al partido más votado en el distrito. Y para el cómputo distrital de los senadores RP, se procede de igual forma.

Por último. Como sólo se pueden hacer coaliciones para candidatos de mayoría relativa, no para las listas RP. Por lo tanto, en las actas RP –disponibles solamente en las casillas especiales– sólo se contabilizaron los votos por un sólo partido.

Va el fundamento: Continue reading

Conteo rápido vs cómputo distrital 2012

En unos minutos concluirá el cómputo distrital (incluyendo recuentos) del IFE para la elección presidencial. Hasta ahora, el cómputo distrital tiene un nivel de avance similar al que tuvo el PREP en su cierre de las 8pm del lunes 2 de julio: 98.5 vs. 98.9%.

¿Cómo se comparan estos resultados con los del conteo rápido? Muy bien, reafirmando una vez más, la validez metodológica del los estudios probabilísticos basados en muestras representativas, mejor conocidos como encuestas.

La concordancia o consistencia de los tres levantamientos es una pieza clave del proceso electoral.

  • Si el conteo rápido y el PREP no coincidieran, una de dos, o la muestra estuvo mal diseñada, o algo raro pasó en la captura de los datos del PREP.
  • Si el conteo rápido y el cómputo distrital no coincidieran, una de dos, o la muestra estuvo mal diseñada, o algo raro pasó con las actas entre el cierre de casillas y el cómputo distrital.
  • Por últimp, si el PREP y el cómputo distrital coinciden tras realizar numerosos recuentos, implica que los errores o inconsistencias de las actas PREP no tuvieron un sesgo, y que los escrutinios realizados en las mesas de casilla son confiables.

(Actualización 6 de julio: el cómputo distrital para presidente ha concluido. La tabla incluye ya los resultados respectivos.)

Elección presidencial México 2012
Candidato Conteo rápido PREP Cómputo distrital
EPN 37.93 – 38.55 38.15% 38.21%
AMLO 30.9 – 31.86 31.64% 31.59%
JVM 25.1 – 26.03 25.40% 25.41%
GQT 2.27 – 2.57 2.30% 2.29%
Margen victoria 6.86* 6.51% 6.62%
Cobertura Muestra 5% 98.95% 100%
*Asumiendo el promedio del intervalo de EPN y AMLO.

Recuento 2012

Al igual que en 2006, tras la pasada elección presidencial se ha desatado una controversia sobre la confiabilidad de la información asentada en las actas de escrutinio y cómputo de cada casilla. Existen diferentes fuentes de error en una elección contada por ciudadanos, a saber:

  • Errores de escrutinio –contar mal los votos, pues– que se reflejan en un acta con datos inconsistentes o con errores aritméticos. Algunos de estos errores se corrigen con la simple inspección del acta, algunos otros requieren abrir y recontar el paquete.
  • Errores de llenado de actas –datos omitidos, ilegibles o mal asentados– que impiden que el PREP contabilice cierta casilla o alguno de sus rubros. Estos errores se subsanan fácilmente durante los cómputos distritales en los que se coteja el acta de casilla original, que se encuentra al interior de cada paquete, con las copias de los partidos, y cuya información se vuelve capturar durante el cómputo. Si algún dato omitido requiere abrir el paquete y recontar los votos, se hace.
  • Errores de captura que se hacen evidentes al comparar el dato reportado por el PREP con la las actas de casilla (o sus imágenes escaneadas por primera vez en esta elección). Estos errores también se subsanan durante los cómputos distritales en los que se coteja y vuelve capturar cada acta de casilla.
  • Diferencias entre los datos encontrados en las “sábanas” al exterior de cada casilla, y los datos reportados por el PREP. Ésta es fácil de explicar: datos legibles en la sábana pueden ser ilegibles en las actas del PREP, o bien pudieron haber sido capturados por error.
A diferencia del 2006, ahora la ley contempla nuevas causales de recuento de casillas. Según el Art. 295 del COFIPE, el Presidente del Consejo Distrital deberá realizar nuevamente el escrutinio y cómputo de una casilla cuando:

PREP 2012 III

Mañana inician los cómputos distritales en los 300 consejos distritales del IFE en el país. En estas sesiones se cotejan las actas de escrutinio originales de cada paquete con las copias de actas en manos de los partidos políticos y, en caso de haber inconsistencias evidentes o de cumplirse alguna de las hipótesis de recuento marcadas en la ley, se abre y revisa el paquete electoral.

Los datos de las “actas PREP” son meramente preliminares y en este momento sólo sirven de guía para identificar casillas con problemas evidentes. Los resultados de las actas originales (que se encuentran al interior de cada paquete) se vuelven a capturar, previa revisión de los consejos distritales y siempre en presencia de representantes de partido político.

En esta última entrada sobre el PREP para presidente 2012, dejaré de lado el “flujo temporal” de los datos (discutido aquí y aquí) para analizar rápidamente algunos resultados clave que ayudarán a comprender lo que viene mañana: el cómputo y posible recuento de casillas.

Distribución de casillas urbanas y no urbanas 

UBICACION 
CASILLA    | Frec.   Porcentaje %Acum.
-----------+-----------------------------------
 Urbana    | 89,955   64.28     64.28
 No urbana | 49,986   35.72    100.00
------------+-----------------------------------
 Total     | 139,941 100.00

 Resultados promedio en casillas urbanas (N=89955)
 Variable | Media    Desv.Est. N
-------------+------------------------------
 epn      | 130.3143 43.60015 89955
 amlo     | 124.7646 64.06251 89955
 jvm      | 94.84739 54.11944 89800
 v_total  | 366.6762 86.89272 89955
 particip | .6244781 .0923858 89228
--------------------------------------------
Resultados promedio en casillas no urbanas (N=49986)
 Variable | Media    Desv.Est. N
-------------+------------------------------
 epn      | 141.7618 64.75295 49986
 amlo     | 87.77438 66.89149 49986
 jvm      | 80.07348 56.75102 49862
 v_total  | 326.9012 118.0007 49986
 particip | .6427021 .1238378 49833
--------------------------------------------

35.7% de las casillas están clasificadas como no urbanas y 64.3% como urbanas. Como se aprecia en la tabla, EPN superó a AMLO por 5.5 votos (130.31 vs. 124.76) en casillas urbanas pero este margen se amplía hasta 53.9 (141 vs. 87) votos en casillas no urbanas. Otro dato curioso es que las casillas no urbanas muestran una mayor tasa de participación que las urbanas: 64.2% vs. 62.4%. (La ventaja rural de EPN ya se había comentado aquí.)

Esta gráfica de caja (box plot) ilustra la distribución de votos (percentil 25, mediana y percentil 75) en casillas urbanas y no urbanas. El panel derecho indica la ventaja de EPN en casillas no urbanas. El panel izquierdo indica que los votos de AMLO a nivel casilla tienen mayor dispersión (varianza) que los de EPN y JVM.

Candidato ganador por casilla

 Ganador |
 casilla | Frec. Porcentaje % Acumulado
---------+-----------------------------------
 JVM     | 25,348  18.04   18.04
 EPN     | 70,657  50.29   68.33
 AMLO    | 44,491  31.67  100.00
---------+-----------------------------------
 Total   | 140,496        100.00

De acuerdo al PREP, EPN ganó en poco más la mitad de las casillas del país: 70,657 casillas. Aquí va un gráfico de pastel (cualquier parecido a los de las encuestadoras es mera coincidencia):

Casillas zapato

Según el PREP, EPN obtuvo el 100% de votos en 9 casillas, AMLO en 6 y JVM en 8. Estas casillas por definición se recuentan durante los cómputos: no se preocupen.

Participación electoral, votos por candidato y margen (EPN – AMLO)

Tradicionalmente, se dice que una mayor participación electoral perjudica al PRI. Dicho de otro modo, que el abstencionismo le beneficia. Una simple matriz de correlaciones (¡la famosa correlación de Pearson aquí sí aplica!) de los resultados por casillas indica lo siguiente:

                   % EPN   %AMLO  %JVM   Margen%  %Particip  
                                         EPN-AMLO
----------------+---------------------------------------------
           %EPN |  1.0000
          %AMLO | -0.5529  1.0000
           %JVM | -0.2589 -0.6398 1.0000
Margen EPN-AMLO |  0.8454 -0.9125 0.2830  1.0000
    % Particip. | -0.0597  0.0173 0.0412 -0.0404 1.0000

N = 127300 casillas

Como se aprecia en la matriz, la correlación entre la tasa de participación de electoral de cada casilla y el porcentaje de votos de EPN es ligeramente negativa, mientras que para AMLO y JVM es ligeramente positiva. La correlación entre participación y margen EPN-AMLO también es negativa: a mayor participación electoral, menor ventaja de EPN sobre AMLO.

Estas correlaciones están dominada por los resultados de casillas urbanas (64% del total de casillas reportado en PREP). Como tenemos evidencia que indica que las casillas urbanas y no urbanas tuvieron patrones de voto distintos, vale la pena analizar la relación participación vs. margen EPN-AMLO en ambos tipos de casillas. Como indica esta última gráfica, en las casillas urbanas en el país hay una correlación negativa entre participación y ventaja de EPN (-0.19). Pero si sólo consideramos casillas no urbanas, la correlación se vuelve positiva (0.07).

Actualización 4-julio-2012.
Sabemos que EPN ganó en la mayoría de casillas y entidades pero el margen de victoria no necesariamente es el mismo. Esta gráfica ilustra el promedio estatal del margen %EPN – %AMLO calculado con base en todas las casillas reportadas en el PREP.

Actualización: 11-julio-2012
Por último, esta gráfica ilustra el margen promedio %EPN – %AMLO en las casillas de cada entidad, distinguiendo entre casillas urbanas y no urbanas (calculado con base en PREP 2012):

PREP 2012 II

El PREP 2012 ya ha finalizado. Aquí les dejo algunas gráficas sobre la evolución del PREP desde su inicio y hasta las 8pm del 2 de julio.

La primera gráfica ilustra la evolución del porcentaje de votos de EPN, AMLO y JVM conforme fueron llegando los paquetes de casilla a las juntas distritales del IFE. Como sabemos, las primeras casillas en llegar son urbanas. SI JVM obtuvo más apoyo en zonas urbanas que rurales, esto puede explicar porque su nivel de votos eoluciona de “más a menos”. AMLO también parece tener cierta ventaja en zonas urbanas, sobre todo en el DF, lo cual puede explicar la curva en forma de U invertida. Por último, EPN parece haber ganado con un amplio margen en zonas rurales, lo cual explica por qué su nivel de votos aumenta lentamente hacia las últimas horas del PREP (las casillas rurales son minoría en el país, pero parecen ayudarle bastante).

La segunda gráfica ilustra la evolución del diferencial o margen porcentual de votos entre EPN y AMLO. El patrón en forma de U verifica los que dije antes: AMLO tuvo cierta ventaja en zonas urbanas –lo cual explica la caída del margen en las primeras 50 mil casillas del PREP, tal y como vimos anoche antes de las 3am– pero EPN se recuperó con las casillas rurales.

Vale la pena destacar que la evolución del PREP no es aleatoria puesto que se trata de un flujo de datos de casillas en tiempo real (“se capturan y suman como van llegando”), y como tal tiene un sesgo urbano y de otro tipo, tales como clima, geografía, tiempo que tarde en cerrarse una casilla, etc. El PREP no es representativo de los resultados nacionales sino hasta que acumula un avance de 80% o más. Lo que sí es cierto es que los porcentajes de voto reflejados en el PREP paulatinamente convergen o se van acercando a la estimación del conteo rápido–la cual sí es representativa del resultado nacional al tener como base una muestra aleatoria de casillas.

Las estimaciones centrales del conteo rápido del IFE, anunciadas antes de la medianoche del domingo, fueron estas: EPN 38.24%, AMLO 31.38%, y JVM 25.56%, con un margen de error máximo de +/- 0.48 puntos porcentuales. Al cierre del PREP, los porcentajes de los candidatos fueron: EPN 38.15, AMLO 31.64, JVM 25.4%. La consistencia entre PREP y conteo rápido son un mecanismo de control muy importante del proceso electoral: si no coincidieran sus tendencias, querría decir que, una de dos, o la muestra estuvo mal diseñada, o algo raro ocurre con las actas del PREP.

SOBRE La sospechosa correlación de Pearson

La tercera gráfica ilustra un punto obvio: si analizamos los votos acumulados de los tres candidatos, encontraremos tres líneas ascendentes con muy alta correlación entre ellas: ¡Lo que sube linealmente correlaciona fuertemente con otra cosa que también sube! Esto de ninguna manera es una anomalía del PREP, sino un error o un engaño (ustedes decidan). De hecho, cualquier suma acumulada tendrá correlaciones de Pearson cercanas a uno. Aquí te comparto mi “PREP de mentiritas” (es un archivo en Excel) para que juzgues por ti mismo.

El flujo de casillas del PREP no es 100% aleatorio

Muchos asumen, equivocadamente, que el flujo de datos del PREP debe ser tan aleatorio como uno proceso estocástico sin tendencia o bien mostrar vaivenes como los de un electrocardiograma. ¿Cómo se vería un PREP 100% aleatorio? Fácil, las primeras 500 o 1000 casillas serían una muestra representativa de las tendencias nacionales y de ahí en adelante las cosas serían bastante aburridas. Para bien o para mal, el PREP no es tan aleatorio como muchos quieren, ni podría serlo, una vez que entiendes que es un proceso de acopio de datos de más de 140,000 casillas hacia 300 centros de captura (y en ese proceso la distancia, infraestructura y geografía de cada distrito importan tanto como las prefencias políticas de cada región). Aquí una gráfica de un PREP 100% aleatorio:

Materiales relacionados

PREP 2012

Acaba de empezar el PREP 2012. Esta entrada irá actualizándose durante la noche (o bien será la primera de varias entradas).

El PREP es un mecanismo de monitoreo, en tiempo real, del flujo de datos electorales de las casillas conforme llegan a los centros de acopio en las 300 juntas distritales del país.  El PREP no es un instrumento de medición que permita hacer pronósticos válidos o confiables toda vez que no está basado en una muestra representativa de casillas, sino en el flujo acumulado, en tiempo real, de las casillas: una especie de censo.  Y como este flujo tiene por naturaleza una serie de sesgos, es muy difícil obtener resultados representativos a partir del PREP.

En 2006, con un resultado tan cerrado, muchos se preguntaron: ¿Por qué Calderón estuvo siempre arriba en el PREP, y AMLO durante gran parte del cómputo distrital? ¿Por qué no hubo “cruce” en el PREP y sí lo hubo en el cómputo distrital? Haciendo un análisis de los datos casilla por casilla provistos por el IFE, encontramos una posible respuesta.

El PREP tiene un sesgo urbano significativo, el cual  favoreció a Calderón. El cómputo distrital tuvo un sesgo partidista y regional significativo, el cual favoreció a AMLO temporalmente, pero al final debía haber un cruce. La combinación de estos sesgos y las preferencias electorales explican el desarrollo del PREP y del cómputo distrital de 2006.

En el PREP 2006, FC inició con ventaja, pero esta se redujo conforme llegaron más y más casillas rurales. Sin embargo, su ventaja se estabilizó en alrededor de 1% en la madrugada del lunes 3 de julio. En 2006, hubo 70% de casillas urbanas y 30% no urbanas: Calderón ganó en las primeras y AMLO en las segundas. En las primeras 7 del PREP se procesaron casi todas las casillas urbanas, mientras que las casillas rurales se tardaron un poco más.

Las siguientes gráficas ilustran lo anterior:

Son las 3 de la mañana y ya circula por ahí que un “científico” encontró un algoritmo en el PREP 2012. ¿Su evidencia? Una correlación de Pearson cercana a 1. Aquí te comparto mi “PREP de mentiritas” (es un archivo en Excel) para que veas por ti mismo que se trata de una mentira.

Materiales relacionados: Análisis estadístico de la elección presidencial de 2006: ¿fraude o errores aleatorios?Política y Gobierno, volumen temático 2009 – Elecciones en México, págs. 225-243. [Micrositio sobre la elección presidencial 2006.]