Las generalizaciones son peligrosas. La falacia de Berkson

La odds ratio es una medida de la fuerza de asociación entre dos variables aleatorias. Para poder generalizar las conclusiones de la muestra a una población, la muestra tiene que ser representativa de la población.
Manuel Molina Arias
Servicio de Gastroenterología. Hospital Infantil Universitario La Paz. Madrid.

A todos nos gusta generalizar y a los estadísticos y epidemiólogos más que a nadie. A fin de cuentas, uno de los propósitos principales de estas dos ciencias es sacar conclusiones de una población inaccesible a partir de los resultados obtenidos en una muestra más pequeña y, por tanto, más manejable.

Por ejemplo, cuando hacemos un estudio sobre el efecto de un factor de riesgo sobre una determinada enfermedad, normalmente lo hacemos con un pequeño número de casos, que es nuestra muestra, pero para sacar conclusiones que podamos extrapolar a toda la población. Claro que, para poder hacerlo, necesitamos que la muestra sea la adecuada y sea representativa de la población en la que queremos generalizar los resultados. Vamos a ver con un ejemplo qué pasa cuando esta premisa no se cumple.

Supongamos que queremos estudiar si los sujetos afectos de neumonía tienen más riesgo de tener hipertensión arterial. Si vamos a lo más fácil, podemos usar nuestra base de datos de ingresos hospitalarios y obtener nuestra muestra de estudio tal como observamos en la tabla I. Vemos que nuestra muestra engloba 135 pacientes que han requerido ingreso, 19 de los cuales tuvieron neumonía y cuatro, además hipertensión. Por otra parte, también podemos ver el número de hipertensos que es de 10, 4 con neumonía y 6 sin ella.

tabla1
Tabla 1. Muestra de pacientes hospitalizados

En primer lugar, vamos a ver si hay asociación entre las dos variables. Para ello podemos hacer un test de la chi-cuadrado bajo la hipótesis nula de no asociación. Yo he usado el programa R para calcularlo. Primero construyo la tabla con el siguiente comando:

Ingreso <- matrix(c(4,6,15,110), ncol=2)

y luego calculo la chi aplicando la corrección de Yates (hay una celda con valor menor de cinco):

chisq.test(Ingreso, correct=T)

Obtengo así un valor de chi = 3,91, que para un grado de libertad corresponde a una p=0,04. Como es menor de 0,05, rechazo la hipótesis nula de no asociación y concluyo que sí hay asociación entre las dos variables.

Ahora, para calcular la fuerza de la asociación calculo su odds ratio, utilizando para ello cualquiera de las calculadoras de epidemiología disponibles en Internet. La odds ratio es de 4,89, con un intervalo de confianza del 95% de 1,24 a 19,34. Concluimos así que los pacientes con neumonía tienen casi cinco veces más riesgo de tener hipertensión.

Y hasta aquí todo va bien. El problema surgiría si caemos en la tentación de generalizar el resultado a la población general. Y esto es así porque la odds ratio mide la fuerza de la asociación entre dos variables siempre que la muestra se haya obtenido de forma aleatoria, lo que no es nuestro caso. Veamos qué pasa si repetimos el experimento con una muestra más grande obtenida, no de nuestro registro hospitalario, sino de la población general (donde están incluidos los participantes en el primer experimento).

Obtenemos así la tabla II, que engloba 2591 pacientes, 211 de los cuales son hipertensos. Siguiendo el mismo procedimiento del primer experimento, calculamos primero la chi-cuadrado, que, en este caso, tiene un valor de 1,86, al que le corresponde una p=0,17. Al ser mayor de 0,05 no podemos rechazar la hipótesis nula, luego tenemos que concluir que no hay asociación entre las dos variables.

tabla2
Tabla 2. Muestra de población general

Ya no tiene mucho sentido calcular la odds ratio, pero si lo hacemos veremos que vale 0,96, con un intervalo de confianza del 95% de 0,73 a 1,21. Como incluye el valor uno, la odds ratio tampoco es significativa.

¿Por qué ocurre esta diferencia entre los dos resultados? Esto ocurre porque los riesgos de hospitalización son diferentes entre los distintos grupos. De los 100 individuos que tienen neumonía (segunda tabla), 4 precisan ingreso (primera tabla), luego el riesgo es de 4/10 = 0,4. El riesgo entre los que tienen solo hipertensión es de 6/111 = 0,05, y el de los que no tienen ninguna enfermedad es de 110/1230 = 0,09.

De esta forma, vemos que los pacientes con neumonía tienen más riesgo que el resto de ser hospitalizados. Si cometemos el error de incluir solo pacientes hospitalizados, nuestros resultados estarán sesgados respecto a la población general, observando así una asociación que, en realidad, no existe. Este tipo de asociación espuria entre variables que se produce por una elección incorrecta de la muestra se conoce con el nombre de falacia de Berkson.

Y aquí lo dejamos. Vemos que el modo de elegir la muestra es de importancia capital a la hora de generalizar los resultados de un estudio. Es lo que suele ocurrir con los ensayos clínicos con criterios de inclusión muy estrictos, que es difícil generalizar sus resultados. Por eso hay autores que prefieren realizar ensayos clínicos pragmáticos, más pegados a la realidad cotidiana y mucho más generalizables. Pero esa es otra historia…

Bibliografía

Contingency tables. En: Pagano M, Gauvreau K, eds. Principles of biostatistics, 2nd ed. Cengage Learning India Private Limited. Delhi, 2000: 342-73.

More from Manuel Molina

Media armónica. Un acertijo con trampa.

La media armónica es el recíproco de la media aritmética. Se calcula...
Read More

2 Comments

  • Qué pasaría en el caso de las estadísticas covid (antes de vacunación), estadísticas covid + vacunación? Siempre he sentido que esas estadísticas no variaron mucho antes y después de la vacunación, incluso al día de hoy creo hay data sesgada, es posible? Puede que estar sucediendo está falacia de Berkson?

    • Gracias Leonardo por tu comentario.
      No entiendo bien tu pregunta. Habría que ver un caso concreto de variable y cómo se realiza el estudio. Si las muestras están bien elegidas y se controlan adecuadamente las variables de confusión, no tendría porqué producirse este sesgo.
      Saludos
      Manolo Molina

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *



Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.