Referendo
Revocatorio de 2004
La figura 1
presenta la última encuesta, antes del revocatorio, llevada a cabo por cada una
de las encuestadoras. Las barras horizontales azules muestran la predicción de
votos de la opción opositora (SI), mientras que la barra roja muestra la intención
de votos de la opción oficialista (NO). Las líneas verticales representan el
resultado real de la elección. Entonces, cuando vemos la figura 1 se puede
observar claramente que tres encuestadoras predijeron con relativa certeza el
resultado electoral: Datanalisis, Hinterlaces y
Varianzas. Al contrario, dos encuestadoras predijeron que la oposición ganaría:
Datos predecía que la oposición ganaría ampliamente mientras que Consultores 21
daba un resultado más parejo.
Figura 1. Predicción de la última encuesta antes del Revocatorio
Estos
resultados se repiten cuando vemos el sesgo pro-gobierno y pro-opositor. En la
figura 2 incluyo todas las encuestas de las diferentes encuestadoras durante el
proceso del 2004. El gráfico incluye el promedio de las diferencias entre el
resultado real y las predicciones de cada encuestadora. Como se puede observar,
tanto Consultores 21 como Datos tienen sesgos significativos en favor de la oposición
mientras que las otras tres encuestadoras muestran sesgos muy bajos.
Figura 2. Sesgo promedio por encuestadora en encuestas previas al Revocatorio
Elección
presidencial de 2006
Como punto
de partida para este análisis debo decir que no creo que la elección presidencial
del 2006 sorprendiera a nadie. A través de todo el proceso se hizo evidente que
Chávez ganaría sin mayores dificultades la elección contra Manuel Rosales. Sin
embargo, siempre existieron rumores sobre el voto secreto y la “espiral del
silencio”; esto, se argumentaba, haría la diferencia para darle la victoria a
Rosales.
Los dos gráficos
siguientes no representan ninguna sorpresa sino más bien una confirmación del análisis
de esta elección. La mayoría de las encuestadoras pudieron predecir con
relativa certeza los resultados, por ejemplo Consultores 21 tiene menos de un
5% de sesgo pro-oposición. La única encuesta que exhibe un sesgo extremadamente alto en favor
de la oposición es la realizada por el Observatorio Hanna Arendt, que utilizo lápices
de tres colores como método para predecir el ganador, esto basado en la teoría dela espiral del silencio. Utilizando este método en el cual se divide la muestra
de participantes en tres grupos y a los integrantes de cada grupo les
corresponde votar con un lápiz de un color (amarillo, azul o rojo), se encontró
una diferencia muy grande entre la intención de voto del grupo que votaba con lápiz
rojo y del que votaba con lápiz azul.
Referéndum Constitucional del 2007
Figura 3. Predicción de la última encuesta antes de la elección presidencial
Referéndum Constitucional del 2007
El
referendo del 2007 es interesante porque fue una elección muy cerrada. Es también
la elección en la que empezamos a ver la existencia de encuestadoras
no-tradicionales con amplios márgenes de ventaja para el gobierno. En cuanto a
los resultados vemos que tres firmas lograron predecir correctamente la elección
en su última encuesta, estas son: Consultores 21, Datanalisis e Hinterlaces.
Por el contrario, tres encuestadoras hicieron un análisis que distaba bastante
de los resultados reales: 30.11 Consultores, IVAD y Keller.
Figura 5. Predicción de la última encuesta antes del referendo
La figura 5
compara la última predicción de cada encuestadora con el resultado de la elección.
Cuando se promedian los sesgos de las diferentes encuestas vemos algunas
diferencias (figura 6). Igual que en el grafico anterior vemos sesgos
considerables en favor del oficialismo por Consultores 30.11 y por el IVAD.
Vemos sesgos de tamaño mediano (5 puntos) por Datanalisis (en favor de la oposición)
y Keller (pro gobierno). Y vemos sesgos pequeños en las encuestas de
Consultores 21 e Hinterlaces. Estas diferencias son en parte debido a la
naturaleza cambiante de la elección que se volvió más y más cerrada a medida
que discurría la campaña.
Figura 6. Sesgo promedio por encuestadora en encuestas previas al Referendo
Referendo
Constitucional 2009
Encontrar
encuestas para el referéndum del 2009 fue bastante difícil. Para este proceso
solo pude obtener datos verificables de 5 encuestas: 3 de Datanalisis y 2 de
Hinterlaces. Sin embargo, dada la importancia de esta elección decidí utilizar
un juego de datos que no pasaría los estándares normales de las publicaciones académicas:
el artículo de Wikipedia sobre el referéndum del 2009. Gracias a este artículo
logre obtener información de 23 encuestas de 8 encuestadoras diferentes. De
estas encuestas, sin embargo, solo pude verificar independientemente 2 ya que
los links de las otras no se encuentran activos. La figura 7 muestra la ultima
encuesta para cada consultora. Como se puede observar existe un sesgo bastante
alto en favor de la oposición. Igual que en los análisis anteriores, para cada
una de las encuestadoras obtuve el promedio de sus errores (que se pueden
observar en la figura 8). Como se puede observar Keller e Hinterlaces tienen
los sesgos pro-oposición más grandes. Asimismo se puede ver como la mayoría de
las encuestadoras erraron del lado de la oposición. Resulta interesante que
tanto el IVAD como GISXXI, dos encuestadoras que usualmente tienen sesgos
grandes, estuvieron acertados en esta oportunidad.
Figura 7. Predicción de la última encuesta antes del referendo
Elección
Parlamentaria de 2010
La ultima elección
en la que participamos los Venezolanos, antes de esta elección presidencial que
se avecina, fue la elección de los miembros de la Asamblea Nacional en 2010.
Esta elección, como la del 2007, fue muy cerrada –por lo menos en cuanto al
porcentaje de votos-. La diferencia de votos entre el gobierno y la oposición fue
muy difícil de predecir y (como se puede ver en la figura 9) solo una
encuestadora logro predecir en su última encuesta: Hinterlaces Consultores 21. Dos
encuestadoras más estuvieron cerca también Consultores 21 Datanalisis y Varianzas, a su vez seguidas por Hinterlaces y GISXXI. Del otro
lado de Hinterlaces Consultores 21 se encuentra GISXXI IVAD, que erró del lado del gobierno en más
de 10 puntos porcentuales.
Mientras la
ultima encuesta provee resultados interesantes, ver los promedios de estos
errores nos da una idea mas completa de la elección. En la figura 10 podemos
ver que tres encuestadoras tuvieron un sesgo pro-gobierno de mas de 5 puntos porcentuales:
Datanalisis, GISXXI e IVAD. Una encuestadora, Keller, tuvo un sesgo mediano en
favor de la oposición, y otras tres tuvieron sesgos pequeños en favor de la oposición:
Consultores 21, Hinterlaces y Varianzas.
****** Este post fue modificado el 1/Agosto/2012 debido a un error en la creación de la figura 9. Este error no altera ninguna de las estimaciones de sesgo presentadas en la última sección del artículo.
Figura 10. Sesgo promedio por encuestadora en encuestas previas a la elección parlamentaria
La elección
del 2012
Que
significa todo esto? Significa que las encuestadoras cometen errores, típicamente
favoreciendo al mismo lado – aunque existe cierta variación. La tabla siguiente
muestra el error promedio de cada encuestadora a favor del gobierno (fila
superior) y a favor de la oposición (fila inferior). Números positivos indican
que la encuestadora dio mayor intención de votos que los votos reales que
obtuvo una opción. Números negativos indican que la encuesta daba números por debajo
de la realidad. Por ejemplo, Datanalisis ha cometido errores tanto a favor del
gobierno (2006 y 2010) como a favor de la oposición (2004 y 2007); lo mismo
ocurre con el IVAD que ha cometido errores grandes pero en lados diferentes. Otras
consultoras por el contrario son más consistentes en el lado al que tienden a
favorecer. Por ejemplo, Consultores 21 tiende a favorecer a la oposición. Hay
una encuestadora (de la que tengo poco conocimiento) que ha sido bastante
consistente en tener errores muy bajos. Esta encuestadora, Varianzas, ha
cometido errores que están dentro del margen de error de sus encuestas. Sin
embargo, solo cuento con encuestas de dos procesos electorales para esta firma.
La última columna indica el error promedio de los cinco procesos electorales para
cada encuestadora.
Tabla 1. Sesgos por encuestadoras y proceso electoral
La tabla 2
muestra la ultima encuesta de cada encuestadora para este proceso electoral.
Incluye las fechas de inicio y cierre de campo y la predicción. Yo agregue tres
columnas que llamo predicción “corregida”. Dos de estas representan escenarios
electorales diferentes. En el primer escenario, se piensa que la oposición esta
por delante pero termina perdiendo (como en 2004 y 2009); este escenario
utiliza el error del 2009 para generar una corrección. En el segundo escenario
se piensa que el gobierno va por delante pero termina ganando la oposición (como
en 2007 y –relativamente- en 2010); en este caso se utiliza el error del 2010
como factor de corrección. Finalmente existe un escenario intermedio que
utiliza el promedio de los errores para corregir las diferentes predicciones de
cada encuestadora.
La última
fila de la tabla indica el promedio de todas las encuestas y todas las
correcciones. Los tres escenarios “corregidos” apuntan a donde puede terminar
la elección del 2012 en base a las encuestas actuales y en base a cada uno de
los posibles escenarios. Por ejemplo, si la dinámica de la elección es similar
a la del 2009 entonces esta elección presidencial seria como la del 2006 y terminaría
en una victoria amplia de Chávez. Si, por el contrario, la dinámica es mas como
las elecciones de 2007 y 2010 entonces los indecisos, o Ni-Ni, serán un factor
importante. Según esta dinámica la diferencia entre Chávez y Capriles se reduciría
a 12 puntos, con Chávez por debajo del
50%. Finalmente, utilizando la corrección en base al promedio Chávez tendría una
ventaja de 19 puntos.
Tabla 2. Predicciones corregidas
En este
punto tengo que decir que, en base a otros análisis que he realizado y puesto
en este blog, me inclino hacia el escenario número 2 que indica que la elección
se encuentra en 46-34. Esto no solo es consistente con mis análisis sino además
con la estrategia opositora –de unidad- que se asemeja más a las estrategias
del 2007 y 2010 que a la del 2004 o 2009.
En términos
generales estos estimados muestran una contienda en donde Chávez tiene la delantera,
pero por un margen menor que el numero de indecisos. La dirección que tome este
grupo de electores podría alterar significativamente la contienda. Para ver
esto más claramente veamos un último grafico. La figura 11 muestra la predicción
corregida promedio para las 8 encuestadoras tanto para Chávez como para
Capriles. Muestra también los valores máximos y mínimos para ambos (todo esto
basado en el escenario 2). La forma de interpretar este grafico es la siguiente:
Chávez esta en algún punto del rango entre 39 y 49, con un promedio de 46%.
Capriles esta en el rango entre 27 y 43, con un promedio de 34. Estos rangos
tienen 5 puntos de coincidencia, que significa es esta elección todavía no se
ha decidido, especialmente si consideramos que la mayoría de estas encuestas se
realizo antes de que la campaña comenzara oficialmente y que la gente empezara
a prestarle atención a la elección.
Figura 11. Rango de predicción promedio corregida
****** Este post fue modificado el 1/Agosto/2012 debido a un error en la creación de la figura 9. Este error no altera ninguna de las estimaciones de sesgo presentadas en la última sección del artículo.