Las triquiñuelas de las estadísticas (II)

16 mayo, 201514 mayo, 2015

José Manuel Lechado
Periodista y Escritor

En la primera parte de este artículo hablamos de algunas de las trampas (fraudes y planteamiento sesgado) que se pueden hacer a partir de estadísticas y encuestas. Continuamos ahora con otros dos apartados llenos de posibilidades: errores de interpretación y falacias.

3. Errores de Interpretación

La Estadística, como procedimiento científico, tiene unas normas muy claras. Pero la exposición, interpretación y presentación de los datos no siempre viene determinada por reglas inamovibles. En muchos casos hay un amplio margen para la subjetividad que el dueño de la estadística aplica según conveniencia. Y, por supuesto, nadie está libre de cometer equivocaciones. El error puede ser fortuito (no siempre hay que pensar mal), pero a menudo, sobre todo en ciertos ámbitos, es intencionado o incluso —como veremos— casi metódico.

El error en las estadísticas (no el «margen de error», que es una cantidad estimada por factores concretos, como el tamaño de la muestra) puede empezar a acumularse desde la misma recogida de datos si ésta se practica de forma poco rigurosa o sin cuidado. Aunque parezca mentira, en muchas ocasiones lo que ocurre es que los datos se contabilizan mal. Un titular posible: «Seis de cada diez españoles creen en adivinos». Leyendo la información de fondo, empero, nos encontramos con esto: «...el 26 por ciento de los españoles dice creer en augures». Al menos uno de los datos es incorrecto, si no ambos. La única certeza en esta noticia, tal como se presenta, es que alguien ha cometido un error de cálculo.

A veces tales fallos son fruto de ignorancia o apresuramiento, pero también puede haber una intención aviesa. Es frecuente leer cosas como: «Los salarios, que el año pasado bajaron un 20 por ciento, han subido este curso un 22 por ciento». Tras esta exposición tan optimista el gobierno anuncia a bombo y platillo su buena gestión que, al parecer, ha hecho crecer el poder adquisitivo de los ciudadanos «un 2 por ciento» (por encima de la inflación, albricias). Sin embargo, un cálculo sencillo demuestra que algo no encaja. Si el sueldo medio por hora hace un año era de 10 euros y baja un 20 por ciento, la cosa se queda en 8 euros miserables. La posterior subida del 22 por ciento implica que, tras la exitosa mediación gubernamental, el trabajador va a cobrar 9,76 euros. Es decir, sigue ganando menos que hace un año, Y es que el nuevo cálculo ha de hacerse, por supuesto, sobre los 8 euros del recorte, no a partir de los 10 originales. Si a esto le unimos la inflación, quizá convengamos en que la acción del gobierno no ha sido tan sagaz como parecía y que más bien hemos sido víctimas de un engaño deliberado. Este tipo de bromas son constantes tanto en la política como en las rebajas de precios, las ofertas bancarias y la publicidad, que con frecuencia se apoyan en estadísticas. Un ejemplo más: cada vez que un gobierno de pacotilla proporciona las cifras oficiales de inversión pública en Investigación y Desarrollo incluye en el bote el dineral destinado a laboratorios militares y armamentísticos, cuyos hallazgos no se puede decir, con seriedad, que contribuyan a ninguna clase de «desarrollo». Es una forma burda, pero efectiva, de disfrazar una mentira con estadísticas.

En ocasiones se llevan a cabo comparaciones erróneas partiendo de datos inadecuados, anticuados o las dos cosas. La lactancia materna, por ejemplo, fue denostada durante años, pues se consideraba que los niños alimentados sólo con la leche de sus madres crecían menos y más despacio. ¿De dónde salía esta creencia? De la comparación de críos de todo el mundo con unas tablas elaboradas en Estados Unidos a partir de una muestra de niños norteamericanos blancos de clase alta o media alta. Un uso tal de información estadística es erróneo, pues datos de este género no son siempre extrapolables. También puede haber intereses privados: no sorprendería saber que tal vez el estudio fuera financiado por empresas fabricantes de leche artificial (es una posibilidad). Como no todo el mundo puede comprar a sus hijos suplementos alimenticios artificiales (pasando por alto si son buenos o no para el crecimiento y la salud de los bebés) es obligatorio llegar a una conclusión: que el uso equivocado o falaz de una información con base estadística tiene consecuencias sociales, culturales y económicas.

Otro error frecuente consiste en establecer una relación de causalidad incorrecta. Es casi seguro que todos guardamos en casa... qué se yo: una camiseta con el logo de The Ramones. O quizá algo con menos glamour: un bote viejo y churretoso de pintura. Al mismo tiempo constatamos que en la vecindad de nuestro barrio no abundan los osos panda. De hecho, jamás se ha visto uno. Se puede establecer la correlación de que si atesoramos un bote usado de pintura (o una camiseta de The Ramones) nunca seremos invadidos por un oso gorrón hambriento de bambú. ¿Parece una relación absurda? No lo es porque, como resulta obvio, no existe vínculo alguno entre los dos sucesos. Sin embargo, en el bombardeo de noticias, mensajes, anuncios, etc. que sufrimos cada día nos colocan correlaciones sin fundamento como esta. Tal forma de interpretación, más que errónea suele ser manipuladora. Es muy frecuente en política —cómo no—, donde si algo no se sabe, se inventa; y si no conviene, se transforma.

Hablando de política: la interpretación de sondeos relacionados con tendencias electorales puede generar valoraciones incluso antagónicas partiendo de los mismos datos. Una al menos será errónea (pueden serlo todas en mayor o menor grado). Un ejemplo imaginario que nada tiene que ver con la realidad actual: un partido recién surgido, de tendencia más o menos izquierdista, arrasa en las encuestas de previsión de voto. Se prevé que en las próximas elecciones pueda incluso llegar a obtener los votos suficientes para gobernar. La interpretación de las encuestas (que sólo reflejan intenciones, expresadas por una muestra de población) será de lo más variada según quién cuente el cuento. Los partidarios de esta nueva organización sienten cierta inquietud: si la gente se convence de que la cosa va bien, puede que muchos votantes potenciales se marchen al campo el día de las elecciones. A fin de cuentas, ¿qué más da voto de más o menos? Los adversarios del nuevo partido lo orientan de otra manera: hay un peligro serio de perder el poder; por lo tanto habría que acudir a votar en masa para evitar la victoria de los «revolucionarios». Aparte de que estos sentimientos pueden inducir a los encuestados a mentir en sus respuestas, el hecho contrastable es que una misma proyección estadística es capaz de surtir diferentes efectos según cómo se interprete. Un ejemplo al que estamos habituados: cada vez que acaba el recuento de votos en unos comicios, cada partido manifiesta satisfecho que «hemos obtenido un gran éxito». Como es obvio, no todos pueden ganar, luego alguien se equivoca o miente. En este caso, y una vez más, quizá no sea tanto un error como una interpretación manipulada de datos estadísticos (en este caso los resultados efectivos de las elecciones).

Para terminar este apartado hablaremos del análisis comparativo impropio, el cual lleva a conclusiones interesadas. Se da mucho en previsiones de tipo industrial, como las relacionadas con algunos productos sanitarios, por poner un ejemplo. Un estudio (pagado por empresas del sector) puede determinar que cierta enfermedad (A) muestra una incidencia mayor de mortalidad que otra (B), por lo que decide invertir sólo en el desarrollo de un medicamento para la primera. Hasta aquí nada que objetar, pues la empresa privada puede hacer con sus recursos lo que le plazca. La cosa se complica cuando el sector privado convence al gobierno de turno para que la sanidad pública adquiera la medicina «anti-A» en detrimento de otros productos. ¿Dónde está la trampa de interpretación estadística? En que es posible que la enfermedad A produzca más muertes por número de afectados, pero también que la enfermedad B afecte a muchísima más gente y sea, de hecho, un problema sanitario de gravedad mayor. Sin embargo, la enfermedad A puede recibir un tratamiento crónico y caro que proporciona pingües beneficios, mientras que la B afecta sobre todo a personas con pocos recursos, las cuales no podrían pagar un tratamiento que, encima, es más barato.

4. Falacias y Paradojas

Las triquiñuelas de las estadísticas incluyen falacias diversas y alguna paradoja que otra. La más conocida es la denominada «falacia del residuo». Muchas muestras estadísticas contienen un porcentaje de datos que no encajan o no tienen explicación. Este «residuo» estadístico suele ser pequeño y se tiende a despreciarlo.

El problema es que a veces se utiliza el residuo como evidencia de algo sin que haya una base real para semejante conclusión. Por eso es una falacia. Un caso muy conocido es el de la pseudociencia llamada ufología, la cual «argumenta» que si más o menos un 5 por ciento de los avistamientos de ovnis no reciben explicación, esto es una «prueba» de que existen los ovnis. La verdad es que, planteado así, es irrefutable: un ovni no es otra cosa que un «objeto volador no identificado». El globo de plástico que se le escapa a un niño de las manos puede ser un ovni perfecto. La cosa cambia si se pretende, ya de paso, que un ovni sea una nave interplanetaria de origen extraterrestre.

Otro ejemplo más serio de falacia del residuo es el siguiente: el departamento de sanidad decide aplicar una vacuna contra la gripe del pato que, según el fabricante, ha demostrado una efectividad del 98 por ciento. Se aplica la vacuna a toda la población (de personas, no de patos), con lo que cabe esperar que la epidemia quede conjurada salvo para ese pequeño 2 por ciento residual, cantidad que el gobierno considera satisfactoria. De entrada cabe preguntarse si un 2 por ciento puede despreciarse con tanta tranquilidad: si el país del que hablamos tiene 50 millones de habitantes, el 2 por ciento es un millón de personas. En una decisión gubernamental de esta guisa deberían pesar más factores que un simple porcentaje: habría que valorar los números absolutos, la gravedad de la enfermedad y el coste de la vacuna.

Antes de que las sondas soviéticas de la serie Venera visitaran Venus y descubrieran la desagradable realidad de ese mundo, los observadores terrestres hacían todo tipo de lucubraciones fantásticas. El astrónomo Carl Sagan describía el fenómeno con mucha gracia en un episodio de Cosmos. Era más o menos así: «En Venus hay nubes. Si hay nubes, tiene que llover. Si llueve, habrá una copiosa vegetación. Si hay selvas, habrá animales. Y si hay animales, siendo un mundo en un estadio primitivo, habrá incluso dinosaurios». Sagan resumía esta serie ilógica de razonamientos de esta manera: «No veo nada, luego hay dinosaurios». La falacia del residuo se parece mucho a esta forma de «razonar».

Otra falacia típica guarda relación con la probabilidad condicionada, que se da en muchos análisis estadísticos. Resumiendo, la probabilidad condicionada implica que un suceso determinado sólo se producirá si antes sucede otro acontecimiento diferente. La probabilidad total sale de multiplicar las probabilidades individuales de ambos. De esta manera se pueden encadenar sucesos desde dos a infinito. Pero hay un peaje: en general, cada suceso añadido disminuye las probabilidades de que ocurra el conjunto de todos (véase al respecto mi artículo «La ecuación V», donde se encadenan varias probabilidades condicionadas a la hora de predecir si un partido cumplirá o no sus promesas electorales en caso de salir vencedor).

Esto son matemáticas de bachillerato, pero su aplicación deficiente a la interpretación de datos estadísticos puede tener consecuencias en la producción económica, la gestión gubernamental o la percepción del público sobre un hecho concreto. La falacia de la probabilidad condicionada suele explicarse con un ejemplo clásico: supongamos una enfermedad grave que sufre, en un momento u otro, el 1 por ciento de la población. No da síntomas hasta que es demasiado tarde, pero por suerte se dispone de una prueba para detectarla precozmente con una fiabilidad del 99 por ciento. ¿Es tan segura como parece? Imaginemos un país con 100.000 habitantes y que todos se someten a dicha prueba. Los resultados son los siguientes: para empezar hay 1.000 personas que de hecho padecen la enfermedad, pero sólo dan positivo 990 (habrá 10 falsos negativos de acuerdo a la fiabilidad prevista). Por otra parte, de las 99.000 personas restantes, que están sanas, dan falso positivo 990. El número total de análisis positivos es de 1.980 personas, la mitad de las cuales (990) no están realmente enfermas. La probabilidad condicionada radica en la combinación de dos factores: la exactitud de la prueba y el hecho de estar o no enfermo. En este caso las cifras finales nos indican que en caso de dar positivo nos respalda una probabilidad muy razonable de estar sanos (el 50 por ciento). Deberíamos preocuparnos lo justo y solicitar una nueva comprobación. Sin embargo, casi nadie hace este tipo de cálculos: si nos sometemos a una prueba con una fiabilidad tan alta y da positivo, es casi seguro que nos echaremos a temblar de miedo e incluso que oigamos batir sobre nuestras cabezas las negras alas de la muerte. De paso habrá también un porcentaje pequeño, pero no despreciable, de enfermos que creerán estar sanos. Los casos de probabilidad estadística condicionada con interpretación errónea son abundantes y se dan en todo tipo de situaciones. Imaginen las consecuencias si la prueba que acabamos de describir se prescribe para una enfermedad con nombre y apellido. Por ejemplo, el sida, con toda su carga de terror y estigmatización social.

Lo que nos lleva a otro tipo de falacia estadística: la de opinión. Son habituales las estadísticas basadas en encuestas periódicas sobre temas de lo más diverso. En España existen las llamadas «demoscopias», que interrogan a muestras considerables de población, una o varias veces al año, sobre cuestiones variadas. Uno de los resultados más populares de las demoscopias son esas listas en las que aparecen las preocupaciones de la gente ordenadas de acuerdo al mayor o menor grado de inquietud que generan. Pues bien, estas clasificaciones no tienen validez para determinar la magnitud de ningún problema, aunque se utilicen tramposamente para ello: sólo evalúan el estado de ánimo de la sociedad o hasta qué punto la propaganda influye en los puntos de vista del común.

En general la opinión pública mayoritaria viene condicionada por las noticias más recientes, impactantes o repetidas. Esto influye en las encuestas: si se ha producido un accidente aéreo pocos días antes de realizar la recogida de datos es posible que la seguridad de las aeronaves figure como una de las inquietudes principales. Del mismo modo, cuando los medios dejan de hablar de un tema, éste desaparece casi por completo de las charlas de taberna y también de las respuestas en esta clase de estudios. En realidad parece que cuando el gobierno y sus medios afines dejan de machacar sobre algo, no sólo se evapora la preocupación pública: nos atrevemos a decir que en muchos casos incluso desaparece el problema en sí.

Un ejemplo notable de esto es la valoración del terrorismo en las encuestas de opinión españolas. En términos absolutos (coste económico, número total de víctimas, posibilidad real de alcanzar sus objetivos políticos, etc.) incluso en los peores tiempos de la violencia política (que comprende un largo periodo y muchos nombres: Eta, Guerrilleros de Cristo Rey, Triple A, Grapo, Terra Lliure, Batallón Vasco Español, Gal, Al-Qaida y otras bandas) el terrorismo en España nunca ha pasado de ser un problema de orden público secundario y en general muy controlado. No obstante, siempre ha logrado un enorme reflejo en los medios de prensa debido a su naturaleza impactante y emotiva. Esto ha repercutido a su vez en la opinión pública hasta tal extremo que en algunas Demoscopias llegó a aparecer el terrorismo como el más grave de los problemas nacionales. A pesar de esta percepción del fenómeno, es un hecho constatable que esta forma de criminalidad ha afectado de manera directa a un porcentaje muy pequeño de la población. No es que la violencia política no sea un problema, pero cabe preguntarse si su reflejo en las encuestas de opinión y en la prensa no resulta exagerado y sirvió (sirve) para justificar políticas de control social y leyes cada vez más represivas que afectan no tanto a los escasos terroristas como a la mayoría de los ciudadanos (también se ha alegado, dicho sea de paso, que el excesivo protagonismo de los atentados en las noticias ha servido a los fines propagandísticos de las organizaciones armadas, aunque esto es otra historia).

Cuando la manipulación en este sentido la practica no España, sino un país importante, se comprueba que la falacia de opinión puede tener consecuencias muy graves. Recordemos que, bajo la excusa del terrorismo, el gobierno de los Estados Unidos ha justificado, a lo largo de la primera década del siglo XXI, varias invasiones de países soberanos. Pero no sólo eso: también ha decretado, con el entusiasmo de sus «federados» (en especial los estados de la muy sumisa Unión Europea) leyes transnacionales que ponen en peligro las libertades ciudadanas, los derechos humanos y la paz.

La falacia de opinión es además paradójica porque los puntos de vista personales no constituyen parámetros objetivos y, por lo tanto, no sirven para extraer conclusiones científicas válidas. Así pues, una encuesta de opinión no puede contemplarse como una verdadera estadística, aunque utilice procedimientos de esta rama de la ciencia. Siguiendo con nuestro ejemplo, incluso hoy día, cuando en España el terrorismo ha quedado reducido a casi nada, todavía persiste su sombra y se da el caso de personas que dejan de viajar a tal o cual país por miedo a sufrir un atentado (postura que se da también en otras naciones). Si estos ciudadanos analizaran con propiedad la información útil, quizá anularían de todas formas su viaje, pero sería por otros motivos: tal vez la mucho más elevada probabilidad de morir de indigestión, trombosis, disentería, malaria, ahogamiento, accidente de tráfico, sobredosis o mordeduras de serpiente, que son causas mucho más probables de perder la vida durante un viaje.

Para quitarnos el mal sabor de boca que deja la violencia terminaremos este apartado con una curiosidad conocida como «paradoja de Condorcet», por ser el matemático francés Nicolás de Condorcet el primero en describirla, allá por el siglo XVIII. Se llama también «paradoja de la votación», porque si bien se describió por primera vez en relación a los juegos de azar, se aplica con frecuencia en contextos electorales para demostrar que las decisiones colectivas (los resultados de unos comicios) tienden a ser cíclicas, aunque las individuales (el voto personal) no lo sean. Se entenderá mejor con un ejemplo no político, sino comercial, pero la estructura y los resultados son extrapolables a otras situaciones:

Se ha realizado una encuesta sobre tres detergentes (Action, Bioful y Costra) con los siguientes resultados:

-Un 33,3 por ciento los ordena así de mejor a peor: Bioful, Costra, Action.
-Otro 33,3 por ciento se decanta por esta ordenación: Costra, Action y Bioful.
-El 33’3 por ciento restante de encuestados elige: Action, Bioful y Costra.

¿Cuál es el mejor detergente (o el peor) según la encuesta? Tómese un tiempo antes de contestar y no haga lo que hace el propietario de Bioful, quien se apresura a decir que el mejor detergente es el suyo (porque el que da primero da dos veces, supongamos). Sin embargo, el dueño de Action reacciona como el rayo y desmiente la interpretación de los datos: en total un 66’6 por ciento de los encuestados cree que Action es mejor que Bioful, luego su detergente es el ganador. El señor Costra, que estaba de vacaciones, al regresar se entera de la noticia y declara que su producto es el mejor, pues un 66’6 por ciento de los encuestados lo considera superior a Action. Como ya imaginará el lector, no tardará en salir a la palestra de nuevo el amo de Bioful asegurando que su detergente es el favorito de dos tercios del personal, por encima de Costra. ¿Quién ha ganado? Nadie. O todos. Este es un caso muy simple de paradoja de Condorcet, pero puede darse en variantes mucho más complejas, con más participantes y datos más enrevesados, en elecciones, apuestas, publicidad... La paradoja en sí no es una falacia, pero sí el uso que de ella hacen los señores Action, Bioful y Costra.

* * * * *

Hay muchas otras trampas y triquiñuelas que se pueden hacer partiendo de datos estadísticos. Hemos querido mostrar aquí algunas de las más notables para divertimento y aviso de los lectores. A las personas interesadas en profundizar en el tema recomendamos el libro El hombre anumérico (Innumeracy: Mathematical Illiteracy and Its Consequences) del matemático estadounidense John Allen Paulos —magnífica y muy divertida obra divulgativa que ha inspirado este artículo y alguno de sus ejemplos— cuya lectura no requiere conocimientos matemáticos especiales.

La estadística es una herramienta científica no ya útil, sino maravillosa e imprescindible. La naturaleza profunda de la realidad sólo puede entenderse en términos estadísticos, como muy bien saben los expertos en mecánica cuántica. La Estadística, con mayúsculas, puede ser el arma fundamental para combatir epidemias, desigualdades sociales o el deterioro del medioambiente planetario. Sin embargo, en manos de desaprensivos (y los hay a manta) la interpretación de datos estadísticos se convierte en un instrumento de manipulación y engaño. La conclusión, si es que hay alguna, no es nueva: fíese de la Estadística, pero no de la propaganda. No se trague la información sin pararse antes a pensar un poco, y cuando le abrumen con una sopa de datos, pregúntese si no le estarán tomando el pelo. Según una estadística, el 84 por ciento de las veces será así.

Público

Las triquiñuelas de las estadísticas (II)

Más opiniones del/a autor/a »

Más Noticias