martes, 17 de junio de 2014

Correlación y causalidad (por si aún alguien duda)

Y, por enésima vez, alguien grita: "¡Correlación no implica causalidad!" 

Y, por enésima vez, esos dos palabros hacen que muchos miren para otro lado porque "ya están los matemáticos dando la vara".

Voy a intentar ponerlo en castellano con ayuda de esta página: Spurious correlations

Si miráis los gráficos, veréis cómo en cada uno aparecen dos curvas similares. En una vemos cómo ha evolucionado un determinado suceso (p.ej. el número de suicidios por ahorcamiento, asfixia y estrangulamiento), y en la otra cómo ha evolucionado otro suceso (p.ej. el gasto de USA en ciencia, espacio y tecnología). La gracia de esta página es justamente lo absurdo de esas parejas. Creo que nadie en su sano juicio afirmaría que subir el gasto en ciencia provoque suicidios. Ni que los suicidios provoquen que el gobierno de USA gaste más en ciencia, ¿verdad?

Pues esa es justo la trampa de la que hablo hoy: de que abusamos de nuestro sano juicio y, cada vez que vemos que dos curvas se parecen, usamos nuestro sano juicio para inventarnos qué causa qué. Los humanos somos fantásticos estableciendo este tipo de conexiones y, sin ellas, no seríamos los animales racionales que somos. Mi hijo de 9 meses pasa el día buscando estas conexiones y repite una y otra vez "tiro la cuchara -> la cuchara cae". Si pintamos la curva del número de tiradas de cuchara en un día y el número de veces que la cuchara cae, lo que nos salen son dos curvas superpuestas una encima de la otra. Un matemático diría que están correlacionadas

Según el diccionario de la RAE, correlación tiene en matemáticas la acepción de: 
4. f. Mat. Medida de la dependencia existente entre variantes aleatorias.
Y entonces es cuando la liamos, porque dependencia implica una subordinación de una cosa a la otra.

La correlación que encuentra mi hijo entre "tirar cuchara" y "caer cuchara", cumple con la definición de la RAE, y esa búsqueda de relaciones causa-efecto (y ya hemos llegado al segundo palabro del título, la causalidad), le permite entender el mundo que le rodea. Aquí, la correlación sí que implica una causalidad: "la cuchara se cae porque la tiro".

La correlación que aparece en la página que os enlacé más arriba, entre suicidios y gasto… ¿qué dependencia establece? ¿existe una relación de causalidad? Aparentemente y según el sentido común dicta, no. En absoluto. Pero para estar seguros de si la hay o no, tendríamos que seguir estudiando esos dos fenómenos. Por ejemplo, podríamos hacer experimentos subiendo o bajando el gasto en una zona del país y viendo si hay más o menos suicidios. O promover un grupo con más suicidios (!) y ver si sube el gasto en esa zona… Aunque vemos que existe una correlación, intuimos que no hay causalidad. Pero no tenemos la certeza de que así sea. 

Si el ejemplo anterior está claro, nadie debería entonces dudar de que muchos estudios supuestamente científicos (y la gran mayoría de los titulares de prensa que les suceden) leen más en los datos de lo que realmente se puede leer. 

Pongo un ejemplo que tengo clavado como una astilla desde 2009, cuando en el metro de Nueva York había carteles que decían que los niños que hacen deporte se meten menos en drogas y animaba a los padres a llevar a sus hijos a hacer deporte. No ponía la fuente del estudio y no llegué a buscarlo. Aún sin mirar los datos, me creo la correlación entre las dos cosas. Suena la mar de razonable que, si el viernes estás de fiesta esnifando coca, el sábado por la mañana no vas al partido. Y que si el sábado estás en el partido, la noche anterior no estabas drogándote. OK. Hay una correlación entre "ausencia de drogas" y "practicar deporte". Ahora vamos a la "causalidad": ¿es primero la gallina o el huevo? ¿los que hacen deporte se ven animados a no meterse en drogas? ¿o los que no se meten en drogas se ven animados a hacer deporte? Apuesto a que fue el sentido común y no un estudio el que pensó que la primera es más razonable: hago deporte -> no me meto en drogas. Dejando los tecnicismos a un lado, hasta que uno no toma un grupo de chavales y pone a unos cuantos a hacer deporte y a otros a no hacerlo y luego mira si unos y otros se meten más o menos en drogas, no puede hablar de causalidad. Lo que no creo es que hayan encontrado un grupo de padres que se presten a que sus hijos sean "obligados" a no hacer deporte para ver si efectivamente se dan a las drogas. Así que, por razonable que me parezca la suposición, no tengo la absoluta certeza de que estas dos cosas estén más relacionadas que los suicidios y el gasto. No tengo más certeza que la que dicta mi sentido común, que no es poco; pero no es todo.

Por lo tanto, mi humilde recomendación cuando uno lee sobre estudios que concluyen que existe una relación de causa-efecto (o causalidad), es que se mire bien la letra pequeña con esta frase resonando de fondo:
"Correlación no implica causalidad"

Esta entrada participa en la Edición 5.5: Ronald Fisher del Carnaval de Matemáticas cuyo anfitrión es pimedios.


1 comentario: