Votos nulos en 2003 y 2006

En las elecciones intermedias de 2003 hubo 896,649 votos nulos (3.3% del total). En 2006 hubo 1,033,665 votos nulos para diputados de mayoría relativa (2.46% del total). Antes de que el movimiento “anula tu voto” se cuelgue la medalla de conseguir más de 1 millón de votos nulos, vale la pena analizar qué estados registraron un mayor porcentaje de votos nulos en 2003 y 2006, respectivamente.

Aquí están las gráficas, ordenadas de mayor a menor tasa de voto nulo.

Porcentaje de votos nulos por estado, 2006.

Porcentaje de votos nulos por estado, 2003.

Votar donde duele

Mucho se ha hablado del voto nulo como herramienta de castigo “a los partidos”. Más allá del valor expresivo (feel good value) de tomarse la molestia de ir a votar… por nadie, vale la pena comentar sobre los efectos observables del voto nulo en México.

El voto nulo cuenta para la tasa de participación (turnout) y para calcular la tasa de votación necesaria para que un partido mantenga su registro de un partido nacional (en México, 2%), pero no cuenta para determinar la asignación de curules por representación proporcional (RP). Esto implica que los votos nulos producen efectos encontrados en la probabilidad de supervivencia de un partido pequeño, por un lado, y en el tamaño de su bancada, si acaso mantiene el registro, por otro.

Veamos un ejemplo con peras y manzanas para ilustrar estos efectos. Consideremos un caso extremo. Si hubiera 10 millones de votos, y 2 millones de votos nulos (20%, una señal fuerte como pocas), cada partido debería conseguir al menos 200 mil votos para mantenerse con vida. Por lo tanto, mientras mayor sea el número de votos nulos, más difícil será librar el umbral mínimo del 2% para cada partido–llamemos a esto efecto umbral.

Sin embargo, una vez superado este umbral, los votos nulos (y los de candidatos no registrados) se restan de la votación total para poder asignar las curules RP entre los partidos “con registro” (como es obvio, los votos nulos no pueden conseguir curules).

Siguiendo con el ejemplo extremo, ¿cuántas curules conseguiría un partido pequeño X–de esos que tanto decepcionan a muchos– de haber conseguido 300 mil votos (y con ello más del 2% requerido para sobrevivir)?

Restemos 2 millones de nulos y asumamos que cero votos para candidatos “no registrados”. Ahora el voto total válido es de 8 millones, y al partido X le corresponderían 3.75% de curules RP, algo así como 7 u 8 curules. Pero, de no haber habido 8 sino 10 millondes de votos válidos (asumamos que ninguno de estos nulos se inclinaría por X), el partido X sólo hubiera recibido 3% de votos y 6 curules RP. Llamemos a esto efecto RP.

Las cifras de este ejemplo son algo exageradas pero el punto central se mantiene: a mayor número de votos nulos, más votos serán necesarios para que cualquier partido sobreviva (a mayor número de nulos, mayor efecto umbral). Sin embargo, aquellos partidos chicos que superen el umbral de 2% de la votación total, acabarán recibiendo más curules RP con relación a las que obtendrían sin los votos nulos (a mayor número de nulos, mayor efecto RP).

El efecto umbral hace la vida difícil a los partidos pequeños. Pero el efecto RP les da más curules a los partidos que sobreviven. Para niveles de voto nulo más realistas, digamos de entre 2 o 3% de la votación total –como los que hemos observado en elecciones pasadas– el efecto umbral y el efecto RP son muy pequeños y practicamente se cancelan mutuamente. Por eso algunos insistimos con necedad instrumental: ¿de qué sirve anular el voto si, aunque te haga sentir como un gran ciudadano castigador en realidad no lastima a (casi) nadie? Mejor hay que votar donde duele.

Elecciones intermedias México 2009

El Universal del día de hoy, Lunes 11 de mayo de 2009, me publicó un breve artículo sobre las preferencias electorales al inicio de la campaña.

“Apenas comenzaron las campañas oficiales rumbo a la elección de diputados federales y ya es común preguntarnos cómo afectará la influenza el resultado del 5 de julio próximo y, sobre todo, si ésta beneficiará o perjudicará al PAN. Antes de especular vale la pena repasar lo que ha ocurrido en elecciones intermedias recientes. En 1997 el PRI perdió 61 curules; y en 2003 el PAN perdió 59 asientos de los 207 con que contaba. Sucede que es común observar que en elecciones intermedias el partido del Presidente pierde fuerza en el Poder Legislativo por muy diversas razones: por un lado los efectos de arrastre de los candidatos presidenciales están ausentes y, por otro lado, se dice que el electorado hace una especie de referéndum sobre la gestión de un presidente que se desgasta más que sus opositores…”

Pueden leer el resto aquí.

Una columna previa sobre popularidad presidencial, publicada el jueves 2 de abril de 2009, está aquí.

Comparative trends in US presidential elections 2000 to 2008

In the final days before the election, pundits and the media will claim that the race “is tightening” and that “you never know what may happen”. To be sure, there is never a 100% certainty, yet I believe the financial crisis pretty much settled the 2008 election (I’ll let you decide to what extent the crisis was a surprise event). Any supporting evidence? This is what Charles Franklin (Univ of Wisconsin, Madison) wrote on Oct 6th, 2008, almost a month before election day:

“The 2008 campaign had not seen a really big move in preferences until the financial crisis hit three weeks ago today. Since that time, the Obama-McCain margin has shifted almost 9 points in Obama’s favor, converting a small McCain lead into a substantial Obama advantage. This swing reversed the gains McCain made with the Republican convention and the week after during which he picked up about 4 points and took the lead for the first time since March.
I wrote earlier that we had not seen a move in 2008 as large as ones we saw in both 2000 and 2004. That is no longer true of 2004, though the current run is not yet as large as the one Gore mounted in 2000.
The Bush counter-assault in 2000, after Gore’s surge, was almost eight points, and began at almost the same point in the campaign, about 57 days out. Voters are making up their minds at about the same rate as they did in 2000. If this year follows that pattern, look for some serious decision making over the next two weeks.

These are Franklin’s critical graphs:

Sam Wang (Princeton Election Consortium) links to the (even clearer) electoral vote predictions for 2004 here, and for 2008 here. He also commented that:

In 2004, candidate game-shifting events were:

7/26: Democratic convention
8/5-31: Swift Boat Veterans for Truth ad campaign
8/30: Republican convention
9/30: Debate #1
The other debates (10/8, 10/13) had no measurable effect.
In 2008, the game-shifting events have been:

6/7: Hillary Clinton concedes
8/1: McCain’s “Celebrity” ad campaign
8/25-9/5: Both conventions and McCain announcement of Palin
9/11-12: Palin on ABC News w/Charlie Gibson, McCain on “The View”
9/26: Obama-McCain debate #1
All of these events were shortly followed by swings.

Public funding and the 2008 election

This is George F. Will, in today's Washington Post, on some of the campaign finance lessons from the 2008 presidential election:
 
Call him John the careless
Thursday, October 30, 2008
 
(…) McCain revived a familiar villain — "huge amounts" of political money — when Barack Obama announced that he had received contributions of $150 million in September. "The dam is broken," said McCain, whose constitutional carelessness involves wanting to multiply impediments to people who want to participate in politics by contributing to candidates — people such as the 632,000 first-time givers to Obama in September.

Why is it virtuous to erect a dam of laws to impede the flow of contributions by which citizens exercise their First Amendment right to political expression? "We're now going to see," McCain warned, "huge amounts of money coming into political campaigns, and we know history tells us that always leads to scandal." The supposedly inevitable scandal, which supposedly justifies preemptive government restrictions on Americans' freedom to fund the dissemination of political ideas they favor, presumably is that Obama will be pressured to give favors to his September givers. The contributions by the new givers that month averaged $86.

One excellent result of this election cycle is that public financing of presidential campaigns now seems sillier than ever. The public has always disliked it: Voluntary and cost-free participation, using the check-off on the income tax form, peaked at 28.7 percent in 1980 and has sagged to 9.2 percent. The Post, which is melancholy about the system's parlous condition, says there were three reasons for creating public financing: to free candidates from the demands of fundraising, to level the playing field and "to limit the amount of money pouring into presidential campaigns." The first reason is decreasingly persuasive because fundraising is increasingly easy because of new technologies such as the Internet. The second reason is, the Supreme Court says, constitutionally impermissible. Government may not mandate equality of resources among political competitors who earn different levels of voluntary support. As for the third reason — "huge amounts" (McCain) of money "pouring into" (The Post) presidential politics — well:

The Center for Responsive Politics calculates that, by Election Day, $2.4 billion will have been spent on presidential campaigns in the two-year election cycle that began in January 2007, and an additional $2.9 billion will have been spent on 435 House and 35 Senate contests. This $5.3 billion is a billion less than Americans will spend this year on potato chips.

New Hampshire and momentum in presidential primaries

Las elecciones primarias en USA apenas comienzan pero ya arrojan resultados interesantes.   He aquí una especulación sobre las encuestas en New Hampshire y, por otro ladoteoría y evidencia sobre  el “momentum” durante las primarias de 2004.
 

 

Before Iowa, Hillary was beating Obama in NH by like 20 points, or at least double digits. After Iowa, Obama got this huge surge in the polls. You can see the time series here. It’s a mystery why the polls were so wrong. I think it comes down to:

 

First – Erikson, Panagopoulos, and Wlezien wrote a paper showing that the Gallup poll overestimates fluctuation in the electorate when using the likely voter screen early in the election. In a nutshell, what happens is this: because the Gallup poll (and most other polls) are interested in interviewing “likely voters” only, they ask a series of screening questions at the beginning of the poll to gauge the respondents’ interest in the election. They then have some formula to determine who is a “likely voter”, and they throw out the remainder of the results. This paper examined the results that were thrown out along with the poll and found that, when something is going wrong for a candidate, their supporters are less enthusiastic and therefore less likely to be considered “likely voters” during this screening process. As a result, many of the supporters of the “losing” candidate just aren’t counted in the poll, because pollsters think they’re not going to vote. This makes fluctuations in polling seem more dramatic than they actually are. (…) This means Obama was never actually leading in NH, and all this talk about “something happened in the last 24 hours” is all a load of BS.

Second – survey weighting. Whenever a pollster does a survey, they need to make the poll representative of the voting electorate. (They) essentially guess what the demographic makeup of the electorate is going to be. Usually this is done on historical data and census data, but it’s always really hard in primaries because they’re not very consistent.  So the pollster will first try to get this breakdown in who they actually talk to, and if they can’t, they’ll then “weight” the survey to simulate the expected breakdown. (…)The pollsters probably saw how weird the electorate was in Iowa (i.e. so many people turned out, and so many young people), that they probably tried to compensate by weighting young people a ton in the following polls to NH. Now, we know that young people support Obama disproportionately. If the pollsters overcompensated for young people, then Obama’s support was artificially strengthened in the polls.

 

MOMENTUM AND SOCIAL LEARNING IN PRESIDENTIAL PRIMARIES

Brian Knight and Nathan Schiff (NBER Working Paper 13637)

http://www.nber.org/papers/w13637

 

Do outcomes of primaries depend upon the sequencing of states? Do sequential, relative to simultaneous, systems lead to different outcomes in terms of the selection of candidates? In our view, the key distinction is that sequential, relative to simultaneous, elections provide late voters with an opportunity to learn about the desirability of the various candidates from the behavior of early voters. This opportunity for late voters to learn from early voting returns can in turn lead to momentum effects.

We develop and estimate a simple model of voter behavior under sequential elections. In the model, voters are uncertain about candidate quality, and voters in late states attempt to infer private information held by early voters from voting returns in early states.  Candidates experience momentum effects when their performance in early states exceeds voter expectations. The magnitude of momentum effects depends upon prior beliefs about the quality of candidates held by voters, expectations about candidate performance, and the degree of variation in state-level preferences. Our empirical application focuses on the 2004 Democratic primary. We find that Kerry benefited substantially from surprising wins in early states and took votes away from Dean, who stumbled in early states after holding strong leads in polling data prior to the primary season.  

The estimated model demonstrates that social learning is strongest in early states and that, by the end of the campaign, returns in other states are largely ignored by voters in the latest states. The voting weights implied by the estimated model demonstrate that early voters have up to 20 times the influence of late voters in the selection of candidates, demonstrating a significant departure from the ideal of “one person, one vote.”

Finally, we simulate the election under a number of counterfactual primary systems and show that the race would have been much tighter under a simultaneous system and that electoral outcomes are sensitive to the order of voting. While these results are specific to the 2004 primary, we feel that they are informative more generally in the debate over the design of electoral systems in the United States and elsewhere.

 

 
 
 

Gobernar sin mayoría, otra vez

La revista Expansión pidió mi opinión sobre el “balance político” de Calderón a los 365 días de haber iniciado su mandato.

Gobernar sin mayoría, otra vez

Felipe Calderón llegó a la presidencia tras una elección sumamente cerrada y un conflicto poselectoral más tenso aún. Con tales antecedentes, la expectativa natural era un primer año plagado de enfrentamientos y golpeteo con sus opositores: ¿podría el Presidente salir a la calle o mantener un control mínimo del gobierno?

Doce meses después, el escenario político no podía ser más contrastante. Es difícil negar que superó las previsiones de muchos: paradójicamente, cuanto más pesimistas eran las expectativas iniciales, mejor resulta el saldo aparente hoy día. ¿Cómo explicar esto? Vayamos por partes.

¿Importa tanto el Presidente? Sí. El Poder Ejecutivo y el Legislativo parten de una perspectiva diferente de la política: el Presidente busca implementar cierto programa de alcance nacional con el aparato administrativo bajo su control, mientras que el Congreso provee un foro de representación y negociación para los diversos partidos políticos. Más allá de sus facultades constitucionales, el Ejecutivo tiene un liderazgo clave para el país y frente al Legislativo.

El pasado importa. Los excesos del presidencialismo priista nos heredaron desconfianza en sus facultades: mala cosa si el Presidente puede hacer demasiado. Por otro lado, el errático gobierno foxista produjo desilusión: el Presidente no podría lograr nada sin una mayoría en el Congreso.

Tras nueve años de gobiernos sin mayoría, muchos apuntábamos que cierta parálisis era inevitable: no habría reformas grandes ni pequeñas hasta que las reglas del juego cambiaran los escasos incentivos para la negociación. Las reformas del primer año calderonista nos obligan a reconsiderar los alcances y límites de nuestro sistema presidencial.

No todos los gobiernos divididos son iguales. En 1997, el PRI perdió la mayoría en la Cámara de Diputados pero no en el Senado. En 2000, el PRI dejó Los Pinos y la mayoría en ambas cámaras, pero se fue la primera fuerza legislativa. Hasta 2006 el PRI fue, por primera vez, tercera fuerza en diputados y segunda en senadores. Con un priismo debilitado, el poder de negociación del Ejecutivo favorece al panismo.

Errores de los rivales. Calderón aprovechó los errores de López Obrador durante la campaña y otro tanto en su primer año. Cuando el PRD se retira de la mesa de negociaciones, propicia el acuerdo entre PAN y PRI (pero no lo abarata). En vez de construir una coalición opositora, la estrategia del PRD facilitó una coalición gobernante: curiosamente, al desconocer al Presidente facilitó su legitimación.

Año de reformas. Las pensiones del ISSSTE, una reforma electoral constitucional, algo parecido a una reforma fiscal y un presupuesto aprobado en tiempo y forma, se pueden contar como éxitos tanto del presidente como del Legislativo. Se puede estar en contra o a favor del contenido, pero es difícil negar que evidencian una relación productiva entre ambos poderes.

El estilo personal. Sin tener gran carisma, Calderón sacó provecho de un buen manejo de imagen y discurso. Mostró una rápida capacidad de respuesta ante los imponderables, un celoso control de su gabinete y cierta disciplina y mesura en sus discursos. Basta contrastar la dupla  Fox-López Obrador con la de Calderón y Marcelo Ebrard para destacar cómo la clase política avanza en su profesionalismo.

Aún es muy pronto para saber si, en su afán por destrabar negociaciones, Calderón sacrificó demasiado en términos del contenido de las reformas o en otro tipo de concesiones. ¿Valen la pena reformas cocinadas al vapor?

El saldo electoral del panismo este año muestra un pobre esfuerzo o una estrategia: ¿acaso se decidió ceder algunas plazas con tal de contar con el apoyo del PRI? Será en 2009 cuando veamos si éste fue un precio muy alto.

Campaign Advertising and Election Outcomes

The recent electoral reform in Mexico will surely change the use of TV and radio ads in political campaigns.  Will this make “media effects” larger or smaller?  The Brazilian experience seems to say larger.
 
 

By: Bernardo S. da Silveira (Department of Economic, New York University)
João Manoel Pinho de Mello (Department of Economics, PUC-Rio)
URL: http://d.repec.org/n?u=RePEc:rio:texdis:550&r=pol
Despite the “minimal effects” conventional wisdom, the question of whether campaign advertising influence elections outcome remains open. This is paradoxical because in the absence of a causal link from advertising to candidate performance, it is difficult to rationalize the amounts spent on campaigns in general, and on TV advertising in particular. Most studies using US data, however, suffer from omitted variable bias and reverse causality problems caused by the decentralized market-based method of allocating campaign spending and TV advertising. In contrast with received literature, we explore a quasi-natural experiment produced by the Brazilian electoral legislation, and show that TV and radio advertising has a much larger impact on election outcomes than previously found by the literature. In Brazil, by law, campaign advertising is free of charge and allocated among candidates in a centralized manner. Guber natorial elections work in a runoff system. While in the first round, candidates’ TV and radio time shares are determined by their coalitions’ share of seats in the national parliament, the two most voted candidates split equally TV time if a second round is necessary. Thus, differences in TV and radio advertising time between the first and second rounds are explored as a source of exogenous variation to evaluate the impact of TV advertising on election outcomes. Estimates suggest that a one percentage point increase in TV time causes a 0.241 percentage point increase in votes. Since TV advertising is the most important item in campaign expenditures, this result sheds light on the more general question of the effect of campaign spending on elections outcome.
Keywords: Campaign Expenditures, Election Outcomes, Endogeneity, Quasi-Natural Experiments
JEL: G12 C22 C53 E44

 

Future research: Foreign soccer players / Narco-campaigning

If I had infinite (ok, just twice more) time I would like to investigate the following:

What is the effect of limiting the number of foreign players in soccer leagues? A cross-country study.

Ideally, this should be a panel with TSCS variation on the legal limits variable.
DepVar: domestic players competitiveness (measured by performance of the country-i team on FIFA tournaments through time)
IndepVars: Number of foreign players allowed or average foreigners enrolled, initial competitiveness, GDP per capita, number of teams in top tier league or number of large stadiums per country… etc.

Logic: if foreign players crowd out domestic talent, local teams should underperform when more foreigners are allowed. But if foreign players raise competitive standards and complement local talent (think of the self-selection and screening effects on the pool of domestic players), then national teams may become more competitive in the presence of foreigners.

Comment: I am not enough of a sports fan to care a lot about this–but whatever the finding, it would give a good economics lesson to all those sports-pundits out there.

Narco-campaigning? Drug money and local democracy in México (or Colombia for that matter)

This also has to be a panel where some localities become “treated” by drug dealers.

DepVar: Turnout or closeness in local elections.

IndepVars: Some sort of index of drug dealing activity at the local level (maybe proxied by drug-related crime?), typical political controls within state and municipality, two-way fixed effects, etc.

Logic: Ok, we know/suspect that drugdealers may want to buyout local authorities. They can do this at the electoral or post-electoral stage. If they give out money to candidates, and we assume some common campaigning technology, you could expect (i) that the extra money leads to higher turnout (compared to state and municipal averages), or (ii) maybe more lopsided elections returns. If the effect is significant it would be indirect evidence of “narco-campaigning”. If the effect is not significant, we would still face many possibilities: either narco campaigning is not affecting election outcomes because drug dealers don’t care much about the electoral stage (vis a vis post-electoral maneuvering)–or maybe drug dealers giving is indistinguishable from other donors elsewhere, or maybe candidates optimize their spending to just about what they need to win, and pocket the rest, etc. (yes, there are many explanations for any nonsignificant outcome!).

Comment: Getting a good proxy for drug-activity may be hard (but who knows, maybe the AFI got some data at hand). But the real downside is worse: if the narc variable turns out to be positive and significant, your life is in danger.

Casillas rurales vs. urbanas en el PREP

La semana pasada estuve en un seminario sobre el PREP en el IFE.  En una de las mesas en las que participé surgió la pregunta: “¿Cómo sabemos si la demora de las casillas rurales en verdad tuvo un impacto significativo en el flujo de datos del PREP?”

 

En el análisis de estadística descriptiva que hice meses antes era obvio que las casillas urbanas llegaron antes, en promedio, que las rurales… y que este sesgo ayudaba a explicar la ventaja inicial (y decreciente) de Calderón sobre AMLO durante la duración del PREP. 

 

¿Cómo podemos verificar esto estadísticamente, más allá de las gráficas?  Comparemos el tiempo promedio de cada tipo de casillas en ingresar al PREP:

 

. by casilla: summ horasdec  (# horas que tardó cada casilla en ingresar al PREP)

———————————————————————-

-> casilla_rural = 0   (casillas urbanas)

    Variable |       Obs        Mean    Std. Dev.       Min        Max

————-+——————————————————–

    horasdec |     85221    5.115121    2.764698          0      24.87

-> casilla_rural = 1   (casillas rurales)

    horasdec |     32066    7.436029    3.501121          0       24.9

 

Como vemos las casillas urbanas llegaron 7.43 – 5.11 = 2.32 horas antes que las rurales.   La varianza de las casillas rurales es mayor, además. ¿Será una diferencia significativa? Podemos hacer un t-test de medias o bien una regresión: 

 

Dep Var: num. de horas que tarda casilla en aparecer en el PREP…

IndepVar: Dummy  casilla_rural/urbana  

 

. regress  horasdec casilla_rural  

      Source |       SS       df       MS              Number of obs =  117287

————-+——————————           F(  1,117285) =14093.54

       Model |  125504.017     1  125504.017           Prob > F      =  0.0000

    Residual |   1044431.6117285  8.90507397           R-squared     =  0.1073

————-+——————————           Adj R-squared =  0.1073

       Total |  1169935.62117286  9.97506622           Root MSE      =  2.9841

——————————————————————————

    horasdec |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]

————-+—————————————————————-

casilla_ru~l |   2.320909   .0195501   118.72   0.000     2.282591    2.359226

       _cons |   5.115121   .0102222   500.39   0.000     5.095085    5.135156

——————————————————————————

 

 

Como se aprecia, las casillas rurales “nada más” están a 118 errores estándar de distancia de las urbanas…  Pero seamos más rigurosos: Veamos si la dummy rural sobrevive al controlar por 32 dummies estatales–a la mejor la heterogeneidad estatal elimina la dicotomía rural/urbano:

 

. areg horasdec casilla, abs(edo)

                                                       Number of obs =  117287

                                                       F(  1,117254) =12373.15

                                                       Prob > F      =  0.0000

                                                       R-squared     =  0.1945

                                                       Adj R-squared =  0.1942

                                                       Root MSE      =   2.835

 

——————————————————————————

    horasdec |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]

————-+—————————————————————-

casilla_ru~l |   2.228325   .0200327   111.23   0.000     2.189061    2.267589

       _cons |   5.140433    .009926   517.88   0.000     5.120978    5.159888

————-+—————————————————————-

         edo |     F(31, 117254) =    409.380   0.000          (32 categories)

 

El coeficiente de diferencia entre casillas rurales y urbanas baja de 2.3 a 2.2 horas.   Pero si esto aún no nos convence, podemos controlar por 300 dummies distritales–quizá la heterogeneidad distrital elimina o absorbe la dicotomía rural/urbano:

 

. areg horasdec casilla, abs(edodist)

                                                       Number of obs =  117287

                                                       F(  1,116986) = 4269.59

                                                       Prob > F      =  0.0000

                                                       R-squared     =  0.3432

                                                       Adj R-squared =  0.3415

                                                       Root MSE      =  2.5629

——————————————————————————

    horasdec |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]

————-+—————————————————————-

casilla_ru~l |   1.373901   .0210263    65.34   0.000      1.33269    1.415112

       _cons |    5.37403   .0094366   569.49   0.000     5.355535    5.392526

————-+—————————————————————-

     edodist |    F(299, 116986) =    140.532   0.000         (300 categories)

 

 

Como vemos, resulta que aún controlando por heterogeneidad distrital, el factor rural añade 1.37 horas de demora promedio frente a las casillas urbanas. Es decir, al interior de cada distrito, las casillas rurales demoraron 1.37 horas más en ser procesadas que las urbanas.  En los tres casos analizados arriba, este impacto es estadísticamente significativo a niveles (muy) inferiores al 1%.

 

Sobra decir que este no es el análisis más exahustivo posible, pero sí es el análisis más básico y sencillo que podemos hacer con los datos del IFE disponibles a la fecha.  Con más datos, podría estimarse un modelo mucho mejor especificado.

Nulidad abstracta vs. 41 millones de votos

Es probable que los magistrados hagan una larga serie de juicios de valor cualitativos antes de calificar la elección presidencial.
Por un lado, quizá el presidente Fox, el apoyo de la CCE, y los spots negativos restaron votos a AMLO. Además, el escándalo Hildebrando, los spots del FOBAPROA, quizá también restó votos a FC. Pero al mismo tiempo quizá la campaña a ras de tierra, el cállate chachalaca, no asistir al primer debate, el discurso clasista, y la lenta respuesta a la campaña negativa de FC también restaron votos a AMLO.
¿Cómo ponderar los errores de campaña de AMLO (¿algún perredista acaso los menciona?) contra los éxitos relativos de la campaña de FC. ¿Cómo calcular el impacto de todos estos factores en la decisión ciudadana de ir o no a las urnas y por qué candidato votar? ¿De verdad hace falta que alguien le diga al electorado qué mensajes debió o no debió escuchar antes de decidir su voto?

Algunos analistas dicen que más vale anular la elección que exacerbar la crisis política. ¿De verdad la opinión de un experto analista vale más que la decisión de más de 40 millones de ciudadanos?

Entre tantas incógnitas quizá sea mejor darle el privilegio de la duda a la ciudadanía: ¿pueden o no pueden tomar una decisión sensata y respetable dada la información que tuvieron disponible durante una larga campaña?

Errores de calculo

La estrategia de AMLO comete varios errores de cálculo: Uno, atacar a un presidente medio bonachón e ineficaz pero al fin y al cabo popular, al tiempo que mantienen secuestrada la capital, es sumamente impopular. Dos, el contradictorio argumento original de que la elección fue “fraudulenta y/o inequitativa”, según convenga, tampoco tiene un consenso mayoritario entre la población. Tres, que los casi 15 millones de mexicanos que votaron por él el 2 de julio están dispuestos a seguirlo en su arriesgada aventura por “purificar la república”: la población en general quizá acepta líderes carísmáticos pero no parece querer más héroes revolucionarios en sus libros de texto gratuito.

Durante su campaña, mediante un reclamo legítimo de atender la pobreza / desigualdad / corrupción, AMLO consiguió gran fuerza y representatividad—y casi gana la elección. Con su nueva estrategia, reclamando un fraude improbable, sitiando la ciudad y llamando a derruir las instituciones (arrebata la mesa, lincha al árbitro y de plano rompe con las reglas del juego), AMLO consigue menos fuerza, menos representatividad y menor apoyo… en resumen, menos legitimidad.

Una simple prueba del ácido: Si toda la elección se anulara y de inmediato tuviéramos nuevas elecciones, AMLO perdería contundentemente y el PRD volvería a su acostumbrado tercer lugar en las cámaras.

En el largo plazo, la estrategia de AMLO quizá le permita sobrevivir como líder de su partido (o de un nuevo partido convencionista) y llegar al 2012. Pero los riesgos y costos iniciales son enormes. Un AMLO alternativo bien podría haber dado una mejor pelea legal hasta que el TEPJF fallará y, de inmediato, cambiar su discurso por un moderado reconocimiento de su derrota y una creíble promesa de “continuar luchando desde cualquier trinchera por el proyecto alternativo de nación”–no hacía falta quemar las naves ni hacer que su bancada se inmolara.

El error de medición (no muestral) de una elección

En esta elección presidencial la ventaja de FC sobre AMLO es de 1.8 votos por casilla y tiene un error estándar de 0.20–este es el error muestral, por asi decirlo, y nos dice que FC está a casi diez errores estándar de distancia de AMLO: estadísticamente AMLO está lejísimos de su rival.

En su columna de hoy, José Antonio Crespo se refiere a lo que también se conoce como “error de medición” o “error no muestral”: una encuesta puede tener una muestra suficiente pero aún así está el error de no respuesta, respuesta  malinterpretada o mal capturada, etc.  Para el caso de una elección escrutada por ciudadanos elegidos al azar lo que preocupa no es el error muestral (130 mil casillas son una muestra igual al universo) sino el error de medición.

Estadísticamente, si el error muestral es mínimo y el margen FC-AMLO es pequeño tenemos que fijarnos en el error de medición que proviene de errores de escrutinio o llenado de actas.  Este error fluctúa entre 1 y 1.5% de las votos de cada casilla (aunque es una medición muy tentativa con datos limitados, ojo).  ¿Es mucho o poco?  Todo depende de cómo está distribuido: si está distribuido de manera aleatoria a lo largo del país, aún si el error de medicion fuese de 5% o 10%, no tendemos mucho problema: todo mundo perdió o ganó un poquito en cada casilla y los errores se cancelan mutuamente.  Pero si el error de medición está sesgado hacia algún lado, tenemos un problema serio.

El TEPJF, a petición de parte, ordenó recontar una muestra muy sesgada de casillas (90% panistas).  Independientemente de lo allí encontrado, de esa muestra sólo podemos inferir el error de medición en cierto tipo de casillas panistas, y no más. Por su parte, la coalición hace cuentas entre alegres con estos errores aduciendo que evidencian irregularidades insoslayables. El problema aquí es que la única forma de saber si este error de medición es alto, bajo o insesgado es comparándolo con una muestra equivalente de casillas perredistas (ie, un grupo de control). Es decir, de un recuento sesgado, como fue el ordenado por el TEPJF, sólo pueden salir inferencias sesgadas.

Algunos juristas  dicen que el TEPJF no extrapolará nada más allá de la evidencia del recuento de casi 12 mil casillas por las mismas razones que no extrapoló los alegatos de AMLO hacia un recuento total–y por tanto no abrirá niguna casilla más… De ser así, un nuevo problema es que en la práctica el TEPJF le estaría dando argumentos al PRD para hacer extrapolaciones sesgadas, que pueden ser falsas, pero sin darle a un observador imparcial elementos para confirmar o desmentir tales extrapolaciones.  Noten que si el PRD lográ anular 4,000 casillas bien seleccionadas (3% del total nacional), la elección se voltearía en favor de AMLO.

Viendo los datos parciales disponibles a la fecha, parece que los errores de medición son tan aleatorios como los errores aritméticos de las actas: pero sin evidencias claras difícilmente el público lo creerá. Curiosamente, las cosas se perfilan hacia que el PAN sea ahora el interesado en un recuento muestral y representativo.  Una vía sencilla de resolver estas dudas sería que el TEPJF recontará una muestra representativa de casillas–como la del conteo rápido del IFE–para verificar si los errores humanos de medición de la elección tuvieron algún sesgo o no.  De no encontrarlo, la coalición difícilmente podría seguir alegando un fraude sistemático en su contra.

¿Qué impacto puede tener un recuento parcial de votos?

Durante el cómputo distrital se abrieron y recontaron 2,864 paquetes electorales, produciendo un ajuste en la votación de todos los rubros y una ligera mejoría en el margen entre PAN y PBT (de 0.58 a 0.583%).

El resultado de este recuento no es representativo de tendencias a nivel nacional, pero sí ofrece indicios del tipo de ajustes que pueden darse en un recuento adicional. Sin ser representativas de diferencias a nivel nacional, los paquetes recontados ofrecen evidencia indirecta sobre el ajuste de votos que puede obtenerse al recontar casillas en zonas panistas o perredistas.

Se trató de una muestra sesgada y no representativa de casillas pues fueron factores políticos y las inconsistencias de las actas los que produjeron su apertura y recuento: 62 y 66% de los 2,864 paquetes recontados fueron de estados y distritos panistas, respectivamente, y en ellos FC tuvo un margen de 5.17% sobre AMLO.

Sin embargo, al clasificar los paquetes por la filiación partidista de sus distritos surgen asimetrías significativas. En casillas de distritos perredistas, el ajuste promedio fue de 13.3 votos menos para AMLO, y de 1.9 votos menos en distritos panistas. Por otro lado, en casillas de distritos panistas, el ajuste promedio fue de 4.7 votos menos para FC, y de 5.8 votos menos en distritos perredistas. Esto resultó en que el margen de votos FC-AMLO disminuyó en 2.9 votos promedio en distritos panistas, pero aumentó en 7.5 votos en distritos perredistas.

De nuevo, al no ser una muestra representativa, NO se puede afirmar que estas tendencias se reproducirían en un recuento a nivel nacional. Pero SI se puede decir que dentro de la muestra de casillas recontadas, las casillas “azules” tuvieron un ajuste distinto al de las “amarillas”.

La moraleja es que si se hace un recuento sesgado, el ajuste obtenido también será sesgado. El sesgo puede provenir de recontar casillas de cierta región, urbanidad o filiación política particulares. Un recuento de una muestra aleatoria y representativa de casillas ayudaría a dilucidar tales sesgos y descubrir si hubo erroreres o diferencias sistemáticas durante la elección.

Si el recuento muestral es legalmente injustificable (poco construible, dicen) entonces los resultados de un recuento parcial deben tomarse con cautela. Si se encuentra un ajuste de +/- 2 votos en una muestra sesgada de casillas, no podemos generalizarlo y decir que si abrimos más casillas seguiremos encontrando el mismo ajuste. De hecho, la evidencia de las 2864 casillas apunta a que, dependiendo del tipo de distrito recontado, será el ajuste hallado.

Es muy probable que existan errores de conteo en múltiples casillas. Siempre los ha habido pero es hasta ahora que se ponen bajo la lupa. También es probable que el error sea aleatorio y se cancele entre unas y otras casillas a nivel nacional. Pero puede ocurrir que el error no sea aleatorio y no se cancele mutuamente a nivel regional.

Los resultados de este análsis preliminar están aqui:
http://www.cide.edu/investigadores/aparicio/elecciones/recuento.ppt

Representantes de casilla y voto presidencial

En los últimos días se ha dicho que una evidencia adicional de irregularidades durante la elección es el hecho de que en zonas donde AMLO no tuvo representantes de casilla, sus votos fueron inusualmente bajos.

Hice un análisis preliminar con datos a nivel estatal y distrital y resulta que lo dicho por la Coalición es parcialmente cierto… pero no sólo para AMLO sino también para Felipe Calderón y Roberto Madrazo: El voto de AMLO, FC y RM es menor en zonas donde tuvieron menos representantes de casilla. Y si esto sucedió a los tres principales candidatos deja de ser una anomalía y se vuelve una regularidad empírica.

¿De donde proviene la relación entre representantes de casilla y niveles de voto presidencial?

Resulta que tanto los representantes de casilla como los votos obtenidos por un partido son proxies de un mismo fenómeno: la fuerza electoral de un partido a nivel local. Si un partido tiene presencia importante en un estado o distrito, seguramente tendrá no sólo votos sino también simpatizantes suficientes para fungir como representates de casilla. Y viceversa, si un partido no tiene presencia en un estado o distrito, seguramente tendrá pocos votos y le será aún más difícil conseguir representantes de casilla.

Así, RC y votos son variables endógenas. En estudios empíricos, decimos que dos variables son endógenas cuando una causa a la otra y viceversa, o bien cuando ambas variables están determinadas simultáneamente por un tercer factor. Matemáticamente estaríamos hablando de un sistema de ecuaciones.

También se dijo que donde había pocos RC había más votos nulos de lo normal. De nuevo, usando datos a nivel estatal y distrital vemos que la relación entre RC y porcentaje de votos nulos es, valga la redundancia, nula (estadísticamente indistinguible de cero, decimos). Un muy buen predictor de votos nulos, en cambio, es el porcentaje de casillas rurales en un distrito: el 60% de los votos nulos provienen de casillas rurales. Por qué ocurre esto es una pregunta importante a futuro.

Pueden ver estos resultados aqui:
http://www.cide.edu/investigadores/aparicio/elecciones/repcasillas.ppt