ESTADISTICA I: TABULACIÓN CRUZADA

La tabulación cruzada es el proceso de creación de una tabla de contingencia desde la distribución de frecuencias multivariada de las variables estadísticas. Muy utilizada en la investigación de encuestas, la tabulación cruzada (o tabla cruzada, de forma abreviada) se suelen producir por una sería de paquetes estadísticos, entre ellos algunos que se especializan en la tarea. Frecuentemente se suelen incorporar ponderaciones de encuesta.

PARADOJA DE SIMPSON

Conclusiones que se obtienen a partir de dos o mas tabulaciones cruzadas y se invierten cuando se agregan los datos en una sola tabulación cruzada.

Un ejemplo que se presenta habitualmente para ilustrar esa situación es la comparación de las tasas de mortalidad de dos hospitales, que pueden favorecer de forma global al hospital A frente al B, y sin embargo al analizarlas por procedimentos se descubre que cambia el signo de la diferencia, debido a que los pacientes con peor prónostico y patologías más graves son internados en el hospital B con mayor frecuencia.

Vamos a plantear un ejemplo concreto: en un estudio comparativo sobre tolerancia de dos fármacos antihipertensivos se determina la presencia o no de efectos secundarios leves y se obtiene los siguientes datos:

		Tratamiento
		A	B
Efecto secundario	NO	410	434	844
Efecto secundario	SI	115	91	206
		525	525	1050

Donde vemos que el 21.9 % de pacientes tiene algún efecto adverso en el grupo A, frente a 17.3 % en el grupo B, diferencia importante pero que no llega al nivel de significación estadística habitualmente aceptado, ya que p = 0.07.

Pero si se separa el estudio en pacientes ancianos (> 75 años) y el resto (< 75 años) se obtienen las siguientes tablas

Pacientes < 75 años

		Tratamiento
		A	B
Efecto secundario	NO	122	351	473
Efecto secundario	SI	8	54	62
		130	405	535

ahora la proporción de efectos adversos, en los pacientes de menos de 75 años, es 6.2 % en el grupo A, frente a 13.3 % en el grupo B, diferencia que es importante y además estadísticamente significativa, p = 0.027, y con signo contrario a la observada en el estudio completo.

En el otro grupo de pacientes de más edad:

Pacientes > 75 años

		Tratamiento
		A	B
Efecto secundario	NO	288	83	371
Efecto secundario	SI	107	37	144
		395	120	515

tenemos un 27.1 % pacientes con reacciones adversas en A, frente a 30.8 % en el grupo B, p = 0.42

Vemos que al considerar la edad (según la clasificación escogida), la relación cambia de signo: en el estudio global era superior la tasa de efectos adversos en el grupo A, pero al estratificar por edad en ambos casos es menor en el grupo A que en el B. Lo resumimos en la siguiente tabla.

	A	B	p
Global	21.9 %	17.3 %	0.07
< 75	6.2 %	13.3 %	0.03
> 75	27.1 %	30.8 %	0.42

La interpretación de una paradoja de este tipo no siempre es fácil, sobre todo cuando hay más de dos estratos; incluso es posible que en ocasiones no tenga interpretación, y en cualquier caso ésta depende siempre de las características de cada estudio.

En este ejemplo está claro que, para ese punto de corte en la edad (75 años), los dos grupos de tratamiento están muy desequilibrados: la proporción de ancianos es de 75.2 % en el grupo A, frente a 22.9 % en el grupo B, y la tasa de efectos adversos en el grupo de pacientes con menos de 75 años es del 11.6 % frente al 28 % en los pacientes ancianos.

ESTADISTICA I

domingo, 3 de junio de 2012

TABULACIÓN CRUZADA

1 comentario:

Datos personales