Del dato al engaño: El truco de la correlación

Hace unos días, el Ministerio de Sanidad difundió un dato alarmante:

“1.060 fallecidos en julio por altas temperaturas, un 57% más que el año pasado.”

El mensaje, acompañado de la foto institucional y un recordatorio para hidratarse, parecía claro: el calor mató a esas 1.060 personas.

Pero aquí hay un problema de base: ni el Ministerio tiene un registro de muertes por calor, ni esos datos prueban que el calor sea la causa directa. Lo que realmente se presenta es una estimación de exceso de mortalidad, es decir, cuántas muertes más hubo respecto a lo esperado en ese mes. Y eso, por sí solo, es correlación, no causalidad.

Qué es la correlación

La correlación es cuando dos cosas suceden al mismo tiempo o se mueven de forma parecida.

  • Ejemplo: en verano sube el consumo de helados y también los casos de ahogamiento.
  • Hay una relación: cuando pasa una, suele pasar la otra.
  • Pero eso no significa que una cause la otra.

En el caso del Ministerio, el razonamiento implícito sería:

  • Hubo más muertes en un mes muy caluroso.
  • Por lo tanto, el calor causó esas muertes.

El problema: la coincidencia en el tiempo no basta para demostrar que una variable provoca la otra.

Qué es la causalidad

La causalidad significa que una cosa provoca directamente la otra.
Para afirmar causalidad, necesitamos demostrar que:

  1. La causa ocurre antes que el efecto.
  2. Hay un mecanismo plausible que explique cómo una provoca la otra.
  3. Hemos descartado otras posibles explicaciones (aquí entran las variables confusoras).

Sin estos pasos, lo que tenemos es una correlación… y una narrativa que puede ser engañosa.

Qué son las variables confusoras

Una variable confusora es un factor que:

  • Está relacionado con la supuesta causa.
  • También influye en el efecto.
  • No se ha tenido en cuenta en el análisis inicial.

Las confusoras pueden:

  • Dar la ilusión de que existe una relación causal que en realidad no existe.
  • Inflar o reducir la fuerza de una relación que sí existe.

Ejemplo sencillo

Observación: Las personas que llevan encendedor tienen más cáncer de pulmón.

  • Causa asumida: El encendedor provoca cáncer.
  • Variable confusora: Fumar (provoca cáncer y hace que la gente lleve encendedor).
    Si no la tenemos en cuenta, atribuimos el efecto a la variable equivocada.

Las confusoras que faltan en la nota del Ministerio (y que no interesa nombrar)

En el caso de la nota de prensa del Ministerio, no se han mencionado —y probablemente ni ajustado— factores que podrían explicar parte o todo el exceso de muertes. Algunos ejemplos:

  • Enfermedades respiratorias o infecciosas que hayan coincidido en el mes.
  • Envejecimiento de la población (más personas vulnerables).
  • Cambios en la atención sanitaria (listas de espera, saturación hospitalaria, falta de personal sanitario).
  • Factores socioeconómicos (pobreza energética, aislamiento social).
  • Contaminación ambiental (ozono y partículas finas aumentan en verano).

Cada uno de estos factores está asociado tanto al mes caluroso como a la mortalidad, y todos ellos son variables confusoras que, si no se miden y ajustan, distorsionan la conclusión.

Por qué importa distinguir correlación de causalidad

Confundir correlación con causalidad no es solo un error técnico:

  • Genera alarma social cuando quizá no toda la cifra se deba al calor.
  • Debilita la confianza en las instituciones si luego los datos se matizan o corrigen.
  • Dirige mal los recursos: si no sabemos la causa real, no podemos diseñar medidas eficaces.

Cómo comunicar datos con rigor

Un mensaje más honesto habría sido:

“En julio hubo un exceso estimado de 1.060 muertes respecto al año pasado. La ola de calor pudo ser un factor, junto con otros elementos como enfermedades, la saturación hospitalaria, el envejecimiento de la población o diversas condiciones socioeconómicas.”

Esto no resta importancia al calor extremo ni a sus riesgos, pero evita presentar como certeza algo que es solo una hipótesis basada en correlaciones.

Entonces, ¿cómo pueden colarnos algo así?

Autoridad percibida – La gente tiende a confiar en fuentes oficiales sin cuestionarlas, especialmente en temas de salud.
Complejidad técnica – La mayoría no entiende metodologías estadísticas, así que es fácil que pasen desapercibidas las manipulaciones de datos.
Medios acríticos – Muchos periodistas simplemente republican comunicados oficiales sin verificar o cuestionar la metodología.
Narrativa conveniente – Encaja con mensajes sobre cambio climático y políticas de salud pública, así que hay menos incentivo para cuestionarlo.

Compártelo: