Autor: Rafael Peñaloza
En estos días está de moda hablar de encuestas. Cuando tenemos elecciones, los adultos con derecho al voto marcamos nuestra preferencia con respecto a los candidatos. Pero antes de que eso ocurra, muchos de nosotros queremos darnos una idea sobre el posible resultado. Ahí es donde aparecen las encuestas.
Supongamos que tenemos a dos candidatos, Arturo y Bruno. Idealmente, nos gustaría saber cuál de los dos ganará, y con qué porcentaje de votos. Pero la única forma de saber esto con precisión es preguntar a todos los votantes. Esto es imposible, y sería extremadamente caro. En lugar de eso, escogemos a unas cuantas personas (por ejemplo, 100) y les preguntamos su preferencia. Si, digamos, 60 de ellas dicen que votarán por Arturo, entonces concluimos que 60% del voto será para este candidato.
Pero ¡cuidado!, las cosas no son tan simples. Primero que nada, tenemos que poner atención a cómo escogimos a esas 100 personas. Si viven en la misma área geográfica, pertenecen a la misma clase social, tienen el mismo trabajo, o se asemejan de cualquier otra forma, el resultado podría no representar realmente a la población total. Por eso tenemos que buscar incluir (proporcionalmente) miembros de cada clase posible. Esta es la parte más difícil al diseñar una encuesta, y el motivo principal por el que los resultados pueden ser drásticamente distintos.
Supongamos que tenemos una metodología perfecta, y que cualquier grupo de 100 personas es igualmente posible de ser elegido para la encuesta. Aún así, no podemos garantizar que el resultado de la elección será del 60% a favor de Arturo. ¿Por qué? Bueno, pues simplemente porque no sabemos nada de lo que harán todos los otros a los que no les hemos preguntado. En realidad, el resultado final de la elección puede diferir del resultado de la encuesta; la pregunta es qué tan diferentes pueden ser. Aquí entra en juego la variabilidad de los resultados. La realidad es bastante más complicada, pero una forma simple de interpretar la variabilidad en este caso es cuánto cambiarían los resultados si alguna de las respuestas cambiara. Viéndolo así notamos que entre más grande es la muestra (o sea, entre más personas son entrevistadas para la encuesta), se aprecia menos variabilidad. Por ejemplo, si de 100 personas una cambia su respuesta, el resultado cambia en 1%, pero si en lugar tenemos a 1000 personas y una respuesta cambia, el resultado sólo se ve afectado en 0.1%.
Esto quiere decir que para mejorar la precisión de una encuesta, querríamos tener una muestra más grande. Pero existe un límite práctico para esto: entrevistar a más personas cuesta más dinero y esfuerzo, y tal vez el beneficio en precisión no compensa el costo extra. Es por esto que en general vemos encuestas con 200, 500, o máximo 1000 participantes. En estos casos, el margen de error será aproximadamente 4%. De ahí que veamos que los resultados se muestren con estos intervalos: 60% ± 4%. En este caso estamos diciendo que el resultado final será algo entre 56% y 64%, pero no afirmamos nada sobre cuál de todos esos valores es el más factible. Cualquier valor en ese intervalo es igualmente válido.
Entonces, si el resultado de la encuesta me dice que Arturo obtendrá el 60% ± 4% de los votos, ¿es seguro que Arturo ganará? Bueno, aquí es donde lo práctico se encuentra con lo teórico. En realidad, esos intervalos que describimos antes se calculan teniendo en cuenta la incertidumbre de los datos. En la práctica, son lo que se llama intervalos de confianza al 95%. En pocas palabras, esto quiere decir que la predicción va a ser correcta 95% del tiempo. 95% suena a mucho, pero veámoslo desde otro lado: si hacemos la misma encuesta muchas veces, entonces 1 de cada 20 estará mal.
Espero que esto haya ayudado un poco a explicar las ideas detrás de las encuestas y sus resultados, y que te ayude a entender mejor cómo estuvieron diseñadas las encuestas que viste en meses pasados respecto a las elecciones en México. Para cualquier duda o comentario sobre estos procesos metodológicos, puedo ser contactado en (rpenalozan@gmail.com).
Acerca del autor
Rafael Peñaloza enseña probabilidad y estadística en la Universidad de Bolzano en Italia. En sus ratos libres, se dedica a estudiar lógica para representación del conocimiento e Inteligencia Artificial.
Editores: Emiliano Cantón, Ximena Bonilla