Sobre la estadística de los sondeos electorales

Aumentar Tamaño del texto Disminuir Tamaño del texto

El efecto que tienen los resultados de sondeos preelectorales en procesos comiciales puede generar suspicacia en torno a los porcentajes y escaños estimados que se publican. Conviene, tanto para fundamentar la suspicacia como para argumentarla en contra, saber un poco acerca de cómo se efectúan los trabajos de campo y cuáles son los errores reportados.


En la película Magic Town, James Stewart descubre un pueblo (Grandview) que tiene las mismas características que el país (misma proporción de demócratas, de mujeres, de pobreza, etc.), una versión a escala de los Estados Unidos de América. Grandview es un ejemplo de una muestra perfecta. Por supuesto, nunca sabemos si una muestra es perfecta hasta conocer la población por completo, pero según la forma en que la construyamos será representativa, es decir, reproducirá las características de la población que deseamos estudiar. Descartando resultados que a veces se publican con datos recogidos de internautas espontáneos o llamadas telefónicas, en los que de entrada una amplia parte de la población bajo estudio está excluida de la muestra, las encuestadoras por lo común usan metodologías estándares para elaborar muestras representativas. Los recientes sondeos elaborados por Opina (para el País) y Metroscopia (para ABC) se basan en lo que en el argot se conoce como ‘selección polietápica’ de los entrevistados. La cosa va más o menos así: (a) escogen unos municipios al azar con una probabilidad proporcional a su número de habitantes; (b) mediante un mecanismo aleatorio, marcan números telefónicos pertenecientes a los municipios seleccionados; (c) asistidos por un ordenador, entrevistan y recogen información. Terminado este proceso, es muy común cruzar porcentajes estimados de indicadores demográficos conocidos (edad y sexo, por ejemplo) que permiten decidir si la muestra es representativa o no, como hace James Stewart en la citada película. Ahora bien, lo anterior no garantiza que la muestra reproduzca bien otras características de la población. Y si no, díganselo a Rip (Stewart), que perdió su reputación por confiar en Grandview.

El margen de error y el nivel de confianza

En estadística se determina la precisión de las estimaciones en términos del margen de error y del nivel de confianza. Para entender que ambos son valores veamos un ejemplo. La muestra de Opina arrojó que el 47% prefería que Zapatero fuera elegido si las elecciones hubiesen sido en marzo de 2007. Si el margen de error es del 3,1% y el nivel de confianza es del 95%, significa que el porcentaje nacional (el cual se desconoce) estará entre el 43,9% y el 50,1%, con una confianza del 95%. Es decir, existe la posibilidad (5%) de que la diferencia entre el porcentaje nacional y la estimación sea cualquier valor mayor que 3,1%.

Si, para estimar el porcentaje de la población que tiene una determinada preferencia electoral tuviésemos enumerados a todos los electores en una lista y seleccionáramos 1.000 al azar con igual probabilidad (muestra aleatoria simple, en la jerga estadística), el margen de error sería 3,1% con el 95% de confianza. Existen esquemas de muestreo que permiten, con muestras de igual tamaño, obtener errores menores (o si se prefiere, mayor confianza). Sin embargo, por conveniencia y economía, es común en la práctica usar muestras polietápicas aunque produzcan errores mayores que el muestreo aleatorio simple. Según Lohr (Sampling: Desgin and Analysis, 1.999), una de las mayores equivocaciones cometidas por las encuestadoras es analizar muestras polietápicas como si fuesen aleatorias simples. Tal confusión hace que los márgenes de error que se reportan en estos estudios sean mucho más pequeños de lo que en realidad son. Es curioso observar que los sondeos electorales recientemente publicados andan por las 1.000 entrevistas y reportan margen de error 3,1% con 95% de confianza, justo como si se tratase de una muestra aleatoria simple.

En última instancia, los errores muestrales a los que nos hemos referido suelen ser despreciables en relación a los no muestrales. Altos porcentajes (30%) de individuos que no responden a la entrevista pueden introducir suficiente sesgo en la selección de entrevistados como para desvirtuar el significado estándar que se le da al margen de error. Esto hace que los sondeos sean más complejos de lo que algunos creen. Por eso la importancia que algunos le dan a "clavar" resultados, a pesar de que, como ya dijimos, pueden estar afectados directamente por los sondeos previos. Mientras los clavan, como le pasó a Rip, el negocio va viento en popa.

Raúl Jiménez
Profesor visitante en el departamento de Estadística de la UC3M