El dilema del vigilante. Sensibilidad y Especificidad

Seguimos profundizando en la Medicina Basada en la Evidencia de la mano del Dr. Molina Arias. En este artí­culo se describen las peculiaridades de las pruebas diagnósticas sensibles y especí­ficas y se introduce el uso de las curvas ROC para la valoración de pruebas diagnósticas..
Molina Arias, M.
Servicio de Gastroenterologí­a Pediátrica
Hospital Universitario La Paz. Madrid

Resumen

Esta publicación se realiza de forma simultánea en el blog“ Ciencia sin seso… locura doble“. ¿Os acordáis del problema de mi cuñado que no sabí­a que vigilante contratar? Porque todaví­a no hemos respondido cuál de los dos vigilantes le aconsejamos que contrate, el que para a casi todo el mundo para mirarle el bolso y ofende a mucha gente que no roba nada, o el que no para a casi nadie pero tampoco falla con el que para, aunque se escapen muchos ladrones. ¿Y cuál creéis que es mejor de los dos? La respuesta es muy sencilla: depende. Los que hayáis leí­do la entrada donde se planteaba este problema ya os habréis dado cuenta de que el primer vigilante (el que registra a muchos) es, sin ánimo de ofender, el sensible, mientras que el segundo es el especí­fico ¿Qué nos interesa más, que el vigilante sea sensible o especí­fico? Pues depende, por ejemplo, de donde tengamos el comercio.

Si lo hemos abierto en un barrio de gente bien, no nos interesará mucho el primero, ya que, en realidad, poca gente robará y nos interesa más no ofender a los clientes para que no se vayan. Pero si ponemos la tienda en frente de la cueva de Alí­-Babá sí­ que nos traerá más cuenta contratarle para que nos detecte el mayor número posible de clientes que se llevan género robado. Pero también puede depender de lo que vendamos en la tienda. Si tenemos un“ todo a un euro“ (o un“ todo a cien“ para los nostálgicos) podemos contratar al vigilante especí­fico, aunque se nos escape alguno (total, perderemos poco dinero). Pero si vendemos joyerí­a fina no querremos que se escape ningún ladrón y contrataremos al sensible (preferiremos que alguien inocente se moleste por ser registrado a que se nos escape uno con un diamante de los gordos). Pues esto mismo ocurre en medicina con la elección de las pruebas diagnósticas: tendremos que decidir en cada caso si nos interesa más una sensible o una especí­fica, porque no siempre las pruebas disponibles tienen una alta sensibilidad (S) y especificidad (E).

En general, se prefiere una prueba sensible cuando los inconvenientes de obtener falsos positivos (FP) son menores que los de los falsos negativos (FN). Por ejemplo, supongamos que vamos a vacunar a un grupo de enfermos y sabemos que la vacuna es letal en los que tienen determinado error metabólico. Es claro que nos interesará que no se escape ningún enfermo sin diagnosticar (que no haya FN), aunque no pasa nada si a algún sano le etiquetamos de tener el error metabólico (un FP): será preferible no vacunar a un sano por pensar que tiene la metabolopatí­a (aunque no la tenga) que cargarnos a uno con la vacuna por pensar que no la tení­a.

Otro ejemplo menos dramático: en medio de una epidemia nos interesará una prueba muy sensible para poder aislar al mayor número posible de enfermos. El problema aquí­ es el de los desgraciados sanos positivos (FP) que meterí­amos con los infectados, a los cuáles harí­amos un flaco favor con la maniobra. Claro que bien podrí­amos hacer, a todos los positivos de la primera prueba, una segunda de confirmación que sea muy especí­fica para evitar este calvario a los FP. Por otra parte, se prefiere una prueba especí­fica cuando es mejor tener FN que FP, como cuando queremos estar seguros de que un enfermo realmente lo está. Imaginemos que el resultado positivo de una prueba conlleva un tratamiento consistente en una operación quirúrgica: nos convendrá bastante estar seguros de que no vamos a operar a ningún sano.

Otro ejemplo es el de las enfermedades cuyo diagnóstico puede ser muy traumático para el paciente y que encima son prácticamente incurables o no tienen tratamiento. Aquí­ primaremos la especificidad para no darle un disgusto innecesario a ningún sano. Por el contrario, si la enfermedad es muy grave pero tiene tratamiento, probablemente prefiramos una prueba sensible.

Hasta aquí­ hemos hablado de pruebas con resultado dicotómico: positivo o negativo. Pero, ¿qué pasa cuando el resultado es cuantitativo? Imaginemos que medimos la glucemia en ayunas. Debemos decidir hasta qué valor de glucemia consideramos normal y por encima de cuál nos parecerá patológico. Y esta es una decisión crucial, porque S y E dependerán del punto de corte que elijamos. Para ayudarnos a elegir disponemos de la curva de caracterí­sticas operativas para el receptor, mundialmente conocida como curva ROC (receiver operating characteristic) (figura 1). Representamos en ordenadas (eje x) la S y en abscisas el complementario de la E (1-E) y trazamos una curva en la que cada punto de corte representa la probabilidad de que la prueba clasifique correctamente a una pareja sano-enfermo tomada al azar. La diagonal del gráfico representarí­a la“ curva“ si la prueba no tuviese capacidad ninguna de discriminar sanos de enfermos.

fig1_roc Como veis en el gráfico de la figura 1, la curva suele tener un segmento de gran pendiente donde aumenta rápidamente la S sin que apenas varí­e la E: si nos desplazamos hacia arriba podemos aumentar la S sin que prácticamente nos aumenten los FP. Pero llega un momento en que llegamos a la parte plana. Si seguimos desplazándonos hacia la derecha llegará un punto a partir del cual la S ya no aumentará más, pero comenzarán a aumentar los FP. Si nos interesa una prueba sensible, nos quedaremos en la primera parte de la curva. Si queremos especificidad tendremos que irnos más hacia la derecha. Y, por último, si no tenemos predilección por ninguna de las dos (nos preocupa igual obtener FP que FN), el mejor punto de corte será el más próximo al ángulo superior izquierdo.
Un parámetro de interés es el área bajo la curva (ABC) (figura 2), que nos representa la probabilidad de que la prueba diagnóstica clasifique correctamente al paciente al que se le practique. Una prueba ideal con S y E del 100% tiene un área bajo la curva de 1: siempre acierta. En clí­nica, una prueba cuya curva ROC tenga un ABC > 0,9 se considera muy exacta, entre 0,7-0,9 de exactitud moderada y entre 0,5-0,7 de exactitud baja. El área bajo la diagonal es de 0,5, punto por debajo del cual la prueba carece de valor diagnóstico. Bueno, en realidad la prueba sin valor es la de la diagonal, ya que valores por debajo se corresponden con un error de clasificación de los sanos como enfermos, y viceversa.
fig2_curvasROC_ABC Curiosas las curvas ROC ¿verdad? Pues su utilidad no se limita a la valoración de la bondad de las pruebas diagnósticas con resultado cuantitativo. Las curvas ROC sirven también para determinar la bondad del ajuste de un modelo de regresión logí­stica para predecir resultados dicotómicos, pero esa es otra historia…

Bibliografí­a

1.- Molina Arias M. Caracterí­sticas de las pruebas diagnósticas. Rev Pediatr Aten Primaria. 2013;15:169-73. (pdf)

Artí­culo publicado en Ciencia sin seso… locura doble

More from Manuel Molina

Horror vacui. Corrección de continuidad de Yates.

Con frecuencia utilizamos aproximaciones con distribuciones de probabilidad continuas para resolver contrastes...
Read More

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *



Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.