ESTADISTICANDO: PARADOJA DE SIMPSON

La paradoja de Simpson (o efecto Yule-Simpson) describe la desaparición de una asociación o comparación significativa de dos variables cuando los datos son desagregados por grupos. También referida como el cambio en el sentido de una asociación entre dos variables (cuantitativas o cualitativas) cuando se controla el efecto de una tercera variable o variable de confusión. Recibe el nombre en honor de Edward Simpson, quien la describió en 1951, aunque fue previamente descrita por el estadístico británico G. Udny Yule a inicios de 1900.

La paradoja es una de las muchas asociadas al estudio de la correlación y muestra que en determinados casos se produce un cambio en la asociación o relación entre un par de variables, ya sean cualitativas o cuantitativas, cuando se controla el efecto de una tercera variable; o, dependiendo de los datos con los que trabajemos, la asociación entre dos variables se puede invertir cuando la población de estudio se divide en subpoblaciones. Esto ocurre, cuando se analiza una variable dependiente respecto a otras variables independientes en algún estudio o experimento. Incluso algunas veces una de las variables (la que hace cambiar el tipo o intensidad de correlación entre las otras) es una variable extraña o no controlada, por lo que el investigador puede no ser consciente de este efecto y llegar a una conclusión incorrecta en su estudio.

Reversión de las desigualdades de Simpson:
Supongamos que para ciertos números enteros se cumplen:

Es posible, a pesar de ello, que si sumamos los distintos numeradores y denominadores de las fracciones que aparecen en ambas desigualdades el orden varíe.

Este hecho es conocido como “reversión de las desigualdades de Simpson”, un ejemplo citado por Malinas y Bigelow es el siguiente:

, mientras que

Explicación gráfica:

La paradoja puede explicarse gráficamente mediante vectores, como hace Julian Havil, para ello, consideremos una tabla, en la que representamos mediante letras el número de pacientes de uno y otro sexo que se han curado cuando se les han aplicado dos medicamentos alternativos, X e Y:

Havil explica la paradoja gráficamente en un diagrama cartesiano, mostrando en el eje de las ordenadas el número de curados y en el eje de abscisas, el número de pacientes al que se le ha administrado cada medicamento. Es posible que, al comparar el porcentaje de curados por cada medicamento, los porcentajes del medicamento X (representados por la línea azul) sean menores que los del medicamento Y (representados por la línea roja) tanto en el caso de hombres (a/b < c/d) como en el de mujeres (p/q < r/s). Sin embargo, cuando consideramos el porcentaje global de pacientes curados por cada medicamento (con independencia de su sexo) ¡puede resultar paradójicamente mayor para el medicamento X que para el Y!
¿Cómo es posible? La clave está en que, al sumar vectores, la pendiente de la suma depende no sólo de la pendiente de los sumandos, sino también de su longitud (obviamente, si todas las pruebas se hicieran sobre el mismo número de pacientes no se podría dar la paradoja).

Ejemplo 1: Imaginemos, en efecto, que estamos intentando comprobar la eficacia del fármaco X. Para ello comparamos el porcentaje de pacientes que se curan tras tomar la medicina con el porcentaje de los que se curan sin haberla tomado (por ejemplo, porque se les administró un placebo).
En un primer hospital se ha administrado el medicamento a 300 pacientes, de los que han sanado 100 (es decir, un 33%); en ese mismo hospital se utilizó un grupo de control de 100 pacientes, a los que no se les dio el medicamento, y de los que se recuperaron 30 (es decir, un 30%). El medicamento parece, pues, elevar ligeramente el porcentaje de curación (del 30 a 33%). En un segundo hospital el medicamento se administró a 100 pacientes, de los que se recuperaron 50 (es decir, el 50%); y de los 300 pacientes utilizados como grupo de control, se curaron 140 (esto es, el 46%). Parece, pues, que también en el segundo hospital el medicamento demostró su eficacia (el porcentaje de curados pasó del 46 al 50%). Ahora bien, si se suman los resultados de ambos hospitales, se comprueba que, en conjunto, el medicamento curó a 150 de los 400 pacientes que lo tomaron; pero, cosa curiosa, de los 400 pacientes que no tomaron la medicina... ¡se curaron 170, es decir, 20 más!
El número y porcentaje de curados se resume en el cuadro que tomo de Hannu Nurmi en 1998:

La paradoja de Simpson tiene un origen puramente aritmético, que está en que los resultados agregados de los experimentos (esto es, los porcentajes de la tercera columna) son el fruto de sumar los numeradores, por un lado, y los denominadores, por otro, de las pruebas en los dos hospitales, para acto seguido dividir ambas sumas y expresarlas en forma de fracción. Ahora bien, como todos sabemos desde nuestra más tierna infancia, ésa no es la forma de sumar fracciones. El resultado de ese "sacrílego" procedimiento de agregación toma siempre un valor intermedio entre las fracciones de las que procede, y tiende a aproximarse más a aquella cuyo denominador es mayor en términos absolutos.
Así, en nuestro ejemplo los porcentajes agregados de curados de la tercera columna están más próximos al resultado de la prueba que se hizo con 300 pacientes (que en el Hospital 1 fueron los tratados con el medicamento y en el Hospital 2 los no tratados). Si todas las pruebas se hubieran hecho con 300 pacientes y los porcentajes de curación se hubieran mantenido inalterados, la paradoja desaparecería.

Ejemplo 2: Una Universidad tiene dos facultades, la de Historia y la de Geografía. Ambas tienen intención de contratar a nuevos empleados. Para contribuir a que haya una mayor igualdad de género en el conjunto de la plantilla de la Universidad, reciben como recomendación que procuren facilitar la contratación de candidatas mujeres.
Concluido el proceso de contratación, se comprueba que la proporción entre el número de contratados y de candidatos ha sido la siguiente:

¿Han seguido las Facultades las instrucciones? ¿Ha logrado su objetivo la Universidad en su conjunto?
Paradójicamente, en ambas facultades el porcentaje de candidatas aceptadas fue mayor que el de hombres, pero, sin embargo, para el conjunto de la Universidad ese porcentaje fue menor (6 contratadas entre 13 candidatas, frente a 7 contratados frente a 13 candidatos).

Ejemplo 3: El Ministerio de sanidad estaba recogiendo datos sobre el éxito en las intervenciones quirúrgicas. Dos hospitales, el hospital clínico de San José y el hospital General Metropolitano estaban en la misma zona y el ministerio iba a cerrar el que tuviera menos éxito de los dos. Los datos son los siguientes:
Hospital San José: Operados: 2100, Defunciones por operaciones: 63 (el 3%)
Hospital Metropolitano: Operados: 800, Defunciones por operaciones: 16 (el 2%)
Para el ministerio la situación es obvia: el hospital General Metropolitano tenía una tasa de mortalidad más baja, así que se cerraría el hospital San José. Cuando fue informado de la decisión del Ministerio y de los datos que avalaban la decisión el director del hospital San José protestó enérgicamente y para defender a su hospital pidió al Ministerio que separase las cifras por sexos para observar las cantidades pertenecientes a hombres y mujeres.
El Ministerio era reacio a hacerlo puesto que lo consideraba una pérdida de tiempo ya que obviamente las cantidades totales seguirían favoreciendo al hospital Metropolitano sin embargo, como era un cálculo muy rápido al final consideró más práctico realizarlo que seguir discutiendo con el director. Estos fueron los datos de ambos hospitales:
Hospital San José: Operados: 600 mujeres y 1500 hombres. Defunciones: 6 mujeres (1%) y 57 hombres (3,8%)
Hospital Metropolitano: Operados: 600 mujeres y 200 hombres. Defunciones: 8 mujeres (1,33%) y 8 hombres (4%)
Al ver estos datos el delegado del Ministerio se queda perplejo (la suma de los datos por sexos da correctamente los resultados originales por lo que no encuentra ningún error): ¡ahora el hospital San José tiene mejores porcentajes en ambos sexos que el Metropolitano! ¿Como es esto posible? Y la pregunta del millón: ¿Qué hospital cerramos y como lo justificamos? Si cerramos uno el otro tiene argumentos para recurrir la decisión ante los tribunales.

Otros ejemplos:
- Ejemplo en el futbol
- Ejemplo en balotas de Martin Gardner
- Ejemplo en alcoholemia
- Ejemplo en discriminación

La paradoja de Simpson tiene mucho de curiosidad matemática, pero aflora en algunas situaciones reales. Nos debe alertar del peligro de comparar porcentajes, sobre todo cuando proceden de poblaciones de tamaño muy distinto, o de colectivos divididos en subgrupos de comportamiento distinto y peso relativo cambiante.
La paradoja de Simpson la conocen bien los analistas de coyuntura económica y, en particular, los estudiosos del mercado de trabajo, pues no es infrecuente que los cambios en la composición del empleo hagan que el crecimiento agregado de los salarios y costes laborales difiera del de los distintos grupos laborales, considerados individualmente. Una bajada general de tipos impositivos puede genera mayor recaudación si las bases imponibles se desplazan hacia los tramos más gravados (y al revés). Por parecido motivo, en fin, a la hora de definir objetivos internacionales en la lucha contra la pobreza (como los contenidos en los llamados Millenium Development Goals aprobados por Naciones Unidas) hay que tener cuidado cuando se formulan en términos de reducción del porcentaje de pobres en cada país: cuando las poblaciones absolutas y el nivel de pobreza de los países difieren significativamente, la evolución de la pobreza global pude diferir de la tendencia en los distintos países, considerados individualmente.

23/4/14

PARADOJA DE SIMPSON

No hay comentarios:

Publicar un comentario