1- Sobre el CIS y los métodos básicos de cocina
Buenas tardes. A falta de empezar a poder calibrar el posible efecto en la campaña del espectáculo de hoy (probablemente en una movilización de la izquierda que veremos si es algo puntual o se prorroga en el tiempo durante la campaña), me entretengo un poco en comentar el CIS. Ya sabéis que no soy muy fan de mi amigo José Félix, pero me gusta dar argumentos, y explicar las cosas, y no entrar en las habituales pullas mediáticas del tipo "El CIS de Tezanos tal o cual". Mi intención hoy es tratar de explicar, en la medida de lo posible, los ajustes que se suelen dar a las cocinas, y, en su caso, estimar cuál ha sido el que se ha realizado en este CIS, que, como todo, siempre puede tener una explicación, aunque quizás las elección de una técnica u otra sea discutible.
Lo primero, aunque ya lo he comentado muchas veces, es comentar los datos básicos que debemos tener en un sondeo sobre intención de voto. Hay 4 cosas que siempre se preguntan, y son la intención de ir a votar (que nos hace hacer una predicción sobre la participación), la intención directa de voto, con la que se estima el % de personas ya decididas por cada partido, la simpatía hacia un partido en particular, que ayuda a determinar posibles pautas de indecisos y el recuerdo del voto en las elecciones más recientes. El CIS además pregunta por muchas cosas más, pero con esas 4 preguntas se pueden hacer estimaciones muy certeras.
No olvidemos tampoco, que cada persona puede mentir, obviar, olvidar o callar alguna respuesta, y que, la intención del sondeo no es intentar adivinar el voto de esa persona en particular, sino la distribución de voto de todas las personas que tienen ese perfil de respuestas (en una muestra de 3.000 sobre 5,5 millones de electores es 1 encuestado por cada casi 2000 electores, y en las nacionales, ronda ese ratio), y finalmente la distribución agregada de esas 3000 distribuciones parciales. No es importante determinar quien miente, sino que porcentaje de personas con una determinada respuesta optarán por una u otra formación política.
Una vez hecho esto, os comento que hay dos tipos de ajustes básicos de los datos brutos:
* Por un lado está el priorizar la IDV (intención directa de voto), o la simpatía por un partido. Ponderar una cosa u otra es importante, porque la experiencia nos dice que por lo general, los electores de izquierdas muestran más fácilmente su intención de voto que los de derechas, pero es que aún hay más diferencia en cuanto a la simpatía, aunque también se da, que muchos electores que simpatizan con fuerzas de izquierda, son menos disciplinados en el voto y van más a la abstención. Es importante pues, determinar de la mejora manera la proporción de importancia que le vamos a dar a cada uno de estos parámetros, para que no tengamos un sesgo excesivo en el pronóstico. Pero... ¿cómo hacerlo?. La lógica nos dice, que cuanto mayor sea la diferencia entre la intención de ir a votar (la primera pregunta que siempre digo que hay que hacer) y la suma de la IDV de los partidos, es decir, el voto decidido, más voto indeciso habrá, y por lo tanto, más fuerza tendrá esa simpatía en la elección. Si, por otro lado, la participación estimada es baja, y sin embargo, la IDV, es decir el voto decidido es porcentualmente grande en comparación con esa participación, se deberá primar en el ajuste la IDV y no la simpatía.
* Y por el otro, está el disyuntiva de priorizar las intenciones declaradas (sean IDV o simpatía) o cruzarlas con los datos de recuerdo de voto de otras elecciones. Y me detengo en esto del recuerdo de voto: siempre se pregunta, a quién votaste en las últimas elecciones, y en la inmensa mayoría de los casos, el recuerdo de voto de la izquierda suele ser mayor al de la derecha en proporción. ¿Por qué?, pues se suman 3 efectos:
a) Un posible sesgo en la muestra, sea en la elección, en la distribución o incluso en el método de entrevista. Si preguntas a una proporción mayor de votantes de ciertos partidos, ese recuerdo será mayor, y por lo tanto, también la intención de voto de esos partidos.
b) Ocultación del voto pasado, pero siguiendo confiando en ese partido,. Se da más en votantes conservadores, que no quieren desvelar ni a quien votaron ni a quien votarán.
c) Ocultación del voto pasado, sin confiar actualmente en ese partido (el voto de la vergüenza). Gente que en su momento votó a un partido y ahora no lo piensa votar, pero tampoco quiere reconocer que lo hizo.
La manera de compensar esos defectos en la respuesta del recuerdo, depende del peso de cada uno de esos 3 factores, que evidentemente también habrá que estimar, pero que nos pueden dar pistas algunas cosas:
a1). Para compensar ese efecto a), es sencillo, transformas la muestra real en una muestra que refleje el el resultado de voto real de las elecciones pasadas y eso lo extrapolas a IDV o a simpatía (en la proporción elegida en el punto anterior). Es decir, determinas que hay un defecto en la muestra, pero que los que han contestado sin significativos de su perfil ideológico.
b1). Es complejo, porque el ajuste anterior infravalora a los partidos que tienen ese voto oculto. En este caso, habría que reajustar doblemente el parámetro anterior. En la práctica es darle más peso al recuerdo de lo que le correspondería.
c1). En este caso, se supone que el que no declara el voto pasado es porque "se avergüenza" y por lo tanto, solo hay que fijarse en la IDV y la simpatía, sin cruzarlo con el recuerdo. Esto es lo que normalmente usa Tezanos, que obvia tanto al a1) (sus muestras son perfectas), como el b1) (en el caso de haber voto oculto está distribuido de igual manera entre las diferentes ideologías).
Cruzando a1) (que cruza el 100% del recuerdo de voto con la IDV), el a3), que cruzaría el 0%, y el a2), que incluso cruzaría algo más de 100% de ese recuerdo, pues tenemos la estimación (que como he comentado antes, también la dividiremos en función de la ponderación a la IDV y a la simpatía).
Después de este rollo, vamos al ejemplo práctico, con este CIS
http://datos.cis.es/pdf/Es3320mar_A.pdf
PREGUNTA 4
Valorar de 0 a 10, la intención de ir a votar. La media es muy alta, y se sitúa en el 9,2. Eso sí, eso implica que habrá una participación del 92%¿?. No tiene por qué y os pongo ejemplos de otros años
* En las elecciones generales de noviembre de 2019, esa media era de 7,8 y la participación en urna fue del 69,85%
* EN las elecciones generales de abril de 2019, la media fue de 8,4 y la participación en urna del 75,75%
* En las autonómicas de Madrid de mayo de 2019, la media fue de 8,5 y la participación en urna del 68,08%
Es decir, siempre hay un desfase entre el voto "decidido" en esa variable y el real, pero además es más marcado en las autonómicas: mientras en las generales suele ser 9 puntos por debajo de lo esperado, en las últimas autonómicas, hubo 17 puntos menos entre la intención y la realidad. En todo caso, todo indica que la participación subirá, y mínimo estaría en el 75% presencial, con posibilidad de llegar al 80% si esa intención declarada es más parecida a las generales.
Pregunta 5R-IDV
PSOE 14.1
PP 27.0
Cs 1.2
Mas Madrid 10.2
VOX 5.3
UP 6.6
Bloque Der: 33.5
Bloque Izq: 30.9
Esta es la IDV declarada y tenemos que el 64,4% de los encuestados, ya tiene claro el destino de su voto, por lo que los indecisos más abstencionistas, serían el resto. Si contamos con una abstención del 20-25%, habría un 10-15% de indecisos sobre el censo. Y a ellos se les dirige la siguientes preguntas:
5aR (a los que han contestado un partido): A qué otro partido podría votar
6R (a los que no han contestado un partido): ¿qué partido te causa más simpatía?
En esta 6R, es donde se da la circunstancia importante en la cocina: de aquellos que no han decidido el voto, un 29% se dice más cercano a partidos de izquierda y un 18% a partidos de derecha. Por lo que cuándo se monta la variable VOTO+SIMPATIA (pregunta 6a), el resultado es el siguiente
PSOE 19.4
PP 30.6
Cs 3.1
Mas Madrid 13.7
VOX 5.8
UP 7.7
Bloque Der: 39.5
Bloque Izq: 40.8
Hay más simpatía por el bloque de izquierda. Entonces queda claro que si se prioriza la IDV habrá mejor resultado a la derecha y si se prioriza la simpatía, suponiendo que muchos de los dudosos votarán a izquierda (que es la mayor en duda), pues el resultado de la izquierda será mayor.
¿cuál es la proporción a utilizar?., Pues nos vamos a los datos de 2019. En ese caso la estimación de participación eral del 85% y el voto lo tenían decidido un 57.6% del censo, por lo que los indecisos en ese momento eran similares a los actuales. Os pongo cuáles eran la IDV, la simpatía y cuál fue el voto final, para ver de esas dos cosas, cuál fue la más decisiva
(pregunta 6a), el resultado es el siguiente
PSOE 17.4/22.4/27.4
PP 13.1/16.2/22.2
Cs 8.0/9.4/19.4
Mas Madrid 8.3/9.3/14.6
VOX 3.1/3.8/8.9
UP 7.7/9.4/5.6
Bloque Der: 24.2/29.4/50.5 (x2.09 sobre IDV y x1.71 sobre simpatía)
Bloque Izq: 33.4/41.1/47.6 (x1.43 sobre IDV y x1.43 sobre simpatía)
Dentro de que ambos ajustes no eran correctos solo con eso (habrá que cruzar recuerdo pues),
usar solo simpatía parece ser incluso más alejado de la realidad, cuando parece que hay un porcentaje importante de abstencionistas que no lo tienen claro. Si, sin embargo, la previsión de participación se dispara, esa proporción sería más ajustada y podría tener sentido.
Nos vamos ahora al recuerdo de voto, y lo comparo con el voto real sobre censo (con el 68,1% de participación que hubo)
PREGUNTA 11a
PSOE 23.9/18.6
PP 16.8/15.1
CS 12.0/13.2
MAS MADRID 7.1/10.0
VOX 5.1/6.0
UP 10.2/3.8
Bloque Der: 39.5/34.3-> x0.87
Bloque Izq: 40.8/32.4-> x0.79
El recuerdo de voto hacia la derecha está algo infra-representado, aunque en este caso, no demasiado en el global. Aquí hago un inciso, y es que el recuerdo de voto para Mas Madrid y UP parece algo confuso, pero es normal, porque en aquel 2019, mucha gente votó Podemos en las generales, Mas Madrid en las autonómicas y municipales o viceversa, por lo que, a efecto del ajuste por recuerdo, los consideraré conjuntos y los ordenaré después por IDV o simpatía declarada, dándoles los mismos multiplicadores.
Y lo comentado, si nos vamos al análisis de las posibles causas del desfase en ese recuerdo, tenemos que a1), la muestra parece más o menos homogénea y no hay mucha diferencia, b1) el voto oculto declarado a la derecha no se puede estimar, pero tampoco hay gran importancia y ac1), el posible voto de vergüenza pasado, que podría afectar a partidos en claro declive como Cs, no se da, porque se ve que la IDV se desploma, pero el recuerdo sí se mantiene. El problema que tiene Cs es que del 13.2% de la muestra que dice que los votó en 2019, menos de 1 de cada 10 (el 1,2% de la muestra) declara ahora que los votaría sin dudar.
Así que, en caso de usar el ajuste con cruce por recuerdo, no es necesario ponderar más o menos sino usarlo como tal.
Y ahora, voy al meollo. Os voy a poner cuáles serían los resultados electorales usando las 4 opciones posibles (solo IDV, solo simpatía, solo cruce 100% IDV-recuerdo y solo cruce 100% simpatía-recuerdo). En todos los casos, ajustaré el resultado a dos decimales y a una suma del 98,05% de los votantes, como ocurrió en 2019
SOLO IDV (A)
PSOE 21.47% - 30
PP 41.11% - 59
Cs 1.83% - 0
Mas Madrid 15.53% -22
VOX 8.07% - 11
UP 10.05% -14
Bloque Der: 51.01% -70
Bloque Izq: 47.05% -66
SOLO SIMPATÍA (B)
PSOE 23.69% - 34
PP 37.36% - 55
Cs 3.79% - 0
Mas Madrid 16.73% -24
VOX 7.08% - 10
UP 9.40% -13
Bloque Der: 48.23% -65
Bloque Izq: 49.82% -71
CRUCE 100% IDV-RECUERDO (C)
PSOE 19.15% - 27
PP 42.37% - 61
Cs 2.31% - 0
Mas Madrid 14.14% -20
VOX 10.93% - 15
UP 9.15% -13
Bloque Der: 53.01% -76
Bloque Izq: 45.04% -60
CRUCE 100% SIMPATIA-RECUERDO (D)
PSOE 21.19% - 31
PP 38.60% - 56
Cs 4.79% - 0
Mas Madrid 15.27% -22
VOX 9.62% - 14
UP 8.58% -13
Bloque Der: 53.01% -70
Bloque Izq: 45.04% -66
Como veis, cuando más se pondera la intención actual en vez del recuerdo, y la simpatía en vez de la intención declarada, la izquierda tiene más oportunidades, pero realmente
solo ajustando a casi el máximo de simpatía les sale la cuenta.
Bueno y cuál es la estimación del CIS?
PSOE 23.4% - 35
PP 36.7% - 55
Cs 4.6% - 0
Mas Madrid 15.1% -22
VOX 8.2% - 12
UP 8.4% -12
Bloque Der: 49.5% -67
Bloque Izq: 46.9% -69
Le da más voto a la derecha, pero al quedar Cs por debajo del 5%, la izquierda suma. Pero a qué se le parece? Es evidente que se ha ponderado más, la simpatía que la IDV, y por otro lado, en este caso, parece que la relación con el recuerdo va al 50%.
Entonces.., qué conclusión tomamos?
Pues que la estimación del CIS, sería coherente con una posible movilización potente de la izquierda, que ahora mismo no se está vislumbrando, pero que si se empieza a mostrar, sería, digamos, como su tope. Si se dan todas las circunstancias apropiadas, podrían llegar a ese resultado, pero lo lógico ahora mismo, es que, por un lado se pondere algo más la IDV, porque el % de dudosos no es tan grande, y por otro lado, se use el recuerdo de voto, porque aunque no era demasiado el sesgo, algo sí se nota.
Si me preguntáis a mí ahora: iría al 60-40 en IDV-simpatía y también en 60-40 en recuerdo/No recuerdo, por lo que ponderaría
A-24%, B-16%, C-36%, D-24%, y me saldría algo así:
PSOE 20.92% - 30
PP 40.36% - 58
Cs 3.02% - 0
Mas Madrid 15.16% -22
VOX 9.31% - 13
UP 9.27% -13
Bloque Der: 52.69% -71
Bloque Izq: 45.35% -65
Victoria clara de Ayuso, pero que necesitaría el SI de VOX, empate entre Monasterio e Iglesias, y muy mal resultado del PSOE. Esa sería, la situación actual, según mi interpretación del CIS; pero claro, como digo, la ponderación de los 4 es algo también subjetivo, si bien tiene sus bases para justificar.
Siento el tochazo, pero creía que era interesante este análisis para ir más allá del titular de prensa y ver cómo se hacen estas cocinas y qué es lo que se prioriza, y si realmente ese resultado puede acabar siendo real, sea por inducción o por cambios en la intención en los próximos 15 días.
Saludos