¿Quién es enfermo y quién sano?

Hasta ahora hemos hablado de pruebas dicotómicas, en las que solo hay dos opciones de respuesta: sí o no, es decir, enfermo o sano, pero en la realidad, los parámetros que se analizan en la mayoría de las pruebas de diagnóstico clínico son parámetros continuos: pueden tomar valores en un intervalo amplio, no únicamente dos valores.

Por ejemplo, los valores de concentración de glucosa en sangre pueden tomar muchos valores, es una variable continua. A aquellos que diseñan las pruebas diagnósticas les encantaría que los valores de estas variables continuas fueran totalmente diferentes en los individuos sanos que en individuos enfermos. Por ejemplo en el caso de la glucosa, lo ideal sería que todas las personas no diabéticas tuvieran concentraciones de glucosa en sangre por debajo de un valor determinado, mientras que todas las personas diabéticas tuvieran valores de concentración de glucosa en sangre superiores a ese valor, como veríamos en la imagen inferior.

Distribución de personas sanas y enfermas en función de la concentración de glucosa en sangre

En esta situación ideal, podríamos diferenciar perfectamente a las personas enfermas de las personas sanas, pero en la realidad esto no ocurre así. En la realidad, estas dos curvas se solapan: para una misma concentración de glucosa encontramos tanto personas sanas como enfermas.

Distribución real de individuos sanos y enfermos en función de la concentración de glucosa en sangre (😔)

Establecer un límite para poder diferenciar a las personas sanas de las enfermas no es fácil en estos casos, y es lo que vamos a tratar en esta entrada.

La concentración de glucosa en sangre se emplea en el diagnóstico de la diabetes. La diabetes es un conjunto de enfermedades, caracterizadas todas ellas por concentraciones elevadas de glucosa en sangre, lo que se denomina hiperglucemia

La glucosa es una de las moléculas que emplean las células de nuestro cuerpo para obtener energía y la conseguimos a partir de los alimentos. Cuando comemos, la glucosa presente en los alimentos se absorbe en el intestino y pasa a la sangre. Cuando esta concentración de glucosa aumenta tras las comidas, el páncreas secreta una hormona, denominada insulina, que incita a las células a tomar la glucosa de la sangre para consumirla o almacenarla. Así, se consigue mantener la concentración de glucosa constante en sangre (este proceso de mantener constantes los diferentes parámetros de nuestro cuerpo se denomina homeostasis). Cuando hay algún fallo en este proceso y se acumula glucosa en sangre, puede provocar que la persona entre en coma diabético, y a largo plazo causa daños en el riñón, sistema nervioso o sistema cardiovascular.

Las concentraciones elevadas de glucosa en sangre pueden deberse a diferentes motivos, en función de los cuales encontramos diferentes tipos de diabetes.

Así, la concentración de glucosa en sangre nos ayuda a diagnosticar esta enfermedad, pero como hemos visto, en la distribución de individuos en función de su concentración de glucosa en sangre, se solapan los individuos sanos y los diabéticos. Establecer un límite a partir del cual se considera que la persona tiene diabetes es complicado, y en función de dónde pongamos este límite, la sensibilidad y la especificidad de la técnica variarán.

Si queremos detectar muy bien a las personas enfermas, fijaremos un umbral de detección bajo, de modo que todas estas tengan una concentración de glucosa mayor. Con este umbral detectaremos a todos los individuos enfermos, pero también habrá una gran proporción de los sanos que diagnosticaremos como enfermos, habrá muchos falsos positivos, señalados en amarillo en la imagen. La sensibilidad de la prueba será muy buena, pero la especificidad no lo será tanto.

Cuando favorecemos la sensibilidad de una prueba, aumenta el número de falsos positivos 

En cambio, si lo que queremos es detectar a todas las personas sanas, estableceremos el umbral de detección en un valor más elevado, de modo que todas ellas tendrán una concentración de glucosa inferior a ese valor. Detectaremos correctamente a todos los individuos sanos, pero habrá muchos enfermos a los que clasificaremos como sanos, señalados en naranja en la imagen. Con este valor umbral, la especificidad será muy buena, pero la sensibilidad no tanto.

Cuando favorecemos la especificidad, aumenta el número de falsos negativos

Así, variando el punto en el que colocamos ese umbral a partir del que determinamos que una persona presenta diabetes, obtenemos una relación entre puntos de corte y sensibilidades y especificidades. 

¿Cómo elegimos el punto de corte?

En este ejemplo, queremos implantar en nuestro laboratorio una prueba para diagnosticar diabetes por medio de la concentración de glucosa en sangre 2 horas después de ingerir un preparado que contiene glucosa. Para ello, analizamos los valores de sensibilidad y especificidad de nuestra prueba en comparación con el Golden Standard para diferentes puntos de corte y obtenemos los siguientes valores.
Queremos valorar, de los tres puntos señalados, 70, 110 y 160 mg de glucosa/100 mL, cuál es el más adecuado para emplearlo en el diagnóstico de una enfermedad como la diabetes.

Para determinarlo, primero vamos a ver lo que ocurriría si empleamos cualquiera de estos tres umbrales para diagnosticar la enfermedad en una población de 71.724 personas, de las cuales 6.570 son enfermas. Elaboramos la tabla de contingencia para cada caso como vimos en la entrada anterior:



Si comparamos estas tres tablas, vemos que para el límite más bajo, el de 70 mg/100 mL, el valor de falsos negativos es muy bajo, 92, mientras que este valor en el límite de 160 mg/100 mL es mucho mayor, de 3.476 personas. En cambio, para los falsos positivos ocurre lo contrario, son muy pocos en el caso del límite superior, 130 personas, mientras que son muchos en el límite inferior, 59.420.

Si analizamos los valores predictivos para cada caso, vemos que el valor predictivo negativo es bastante bueno en todos los casos, la probabilidad de ser sano obteniendo un resultado negativo es bastante alta, entre casi el 95% para el límite de 160 mg/100 mL y 98,42% para el límite de 70 mg/100 mL. En cambio, el valor predictivo negativo varía mucho para los tres puntos, siendo un valor muy elevado para el límite superior, 95,96%, no muy bueno para el límite de 110 mg/100 mL, 35,21% y bastante malo para el límite inferior, 9,83%. Con estos valores, vemos que el límite que nos permite tener una mayor capacidad predictiva sería el límite de 160 mg/100 mL, por lo que podríamos pensar que este es el límite que tendríamos que establecer, pero hay más cosas que tenemos que considerar.


Curvas ROC

Además de las herramientas que hemos mencionado en entradas anteriores para evaluar la bondad de una prueba, tenemos otras, como las curvas ROC. Mediante esta herramienta podemos relacionar la sensibilidad y la especificidad de una misma prueba para diferentes puntos de corte, y determinar el punto de corte más adecuado. Además, nos permite comparar varias pruebas para elegir la mejor de ellas calculando el área bajo la curva, de modo que cuanto mas se acerque a 1, mejor será la prueba.

Para construir esta curva ROC, lo que hacemos es representar en el eje vertical la sensibilidad y en el horizontal 1-especificidad. Así, obtenemos curvas que se acercan más o menos a la diagonal. Cuanto más cerca estén de la diagonal, peor nos permitirán discriminar a los enfermos de los sanos, de modo que de las tres pruebas que se ven en la imagen, la azul será la que tendrá una menor exactitud a la hora de aplicarla al diagnóstico. Si la curva ROC de nuestra prueba pasase por la diagonal, no nos permitiría distinguir a los sanos de los enfermos.

En el caso que hemos planteado, la curva ROC que obtendríamos sería la siguiente:

Podemos ver que es una curva que se aleja bastante de la diagonal, la línea de no determinación, por lo que podemos decir que es un test bastante bueno. Pero, ¿cómo elegimos el punto ideal para establecer el límite? 

La curva ROC de una prueba ideal, que nos permite discriminar sin ningún error a las personas enfermas de las sanas  sería la curva roja, y el punto ideal sería el punto en el que la sensibilidad es 1 y 1-especificidad es 0. Cuando no tenemos esta curva ideal, elegiremos el punto de la curva que sea más cercano al vértice superior izquierdo de la gráfica.

Así, para nuestro caso, el punto de corte ideal según la curva ROC sería el de 110 mg/100 mL. 

Esto podemos comprobarlo además por medio del índice de Youden, que también nos ayuda a elegir el punto de corte más válido. El índice de Youden es un parámetro que aúna la sensibilidad y la especificidad y nos permite calcular el mejor punto de corte. Este índice se calcula sumando la sensibilidad y la especificidad y restando 1. Cuanto más cerca se encuentre este valor, mejor será ese punto de corte, ya que clasificaremos de forma errónea a una menor proporción de personas. Si calculamos el índice de Youden para cada punto de corte, vemos que el índice de Youden es más alto en el punto de corte de 110 mg de glucosa/100 mL.

Por otro lado, podemos emplear también la razón de verosimilitud para evaluar qué punto de los tres es más adecuado. Si calculamos las razones de verosimilitud positivas y negativas, vemos que el punto de corte de 70 mg/100 mL tiene una razón de verosimilitud negativa pequeña, lo que nos indica que la prueba es muy buena para descartar la enfermedad, pero al ser también pequeño el valor de la razón de verosimilitud positiva, no es una prueba buena para diagnosticar la diabetes. 

En cambio, para el punto de corte de 160 mg/100 mL ambos valores son elevados, por lo que la prueba será buena para diagnosticar la enfermedad, pero no es buena para descartar la enfermedad. 

Por su parte, cuando establecemos el punto de corte en 110 mg/100 mL vemos que el hecho de que un enfermo obtenga un resultado positivo es más de 5 veces más probable que el hecho de que un individuo sano obtenga este resultado positivo, que es un valor aceptable para una prueba diagnóstica, mientras que el hecho de que una persona diabética obtenga un resultado negativo es 0,17 veces más probable que el hecho de que lo obtenga una persona sana, que también es un valor bastante aceptable.

Normalmente se considera que las técnicas válidas deben tener una razón de verosimilitud positiva por encima de 10 y una razón de verosimilitud negativa inferior a 0,1, pero cuando RV+ está entre 5 y 10 y RV- entre 0,1 y 0,2 la prueba es bastante adecuada para el diagnóstico.

Como hemos visto en la anterior entrada, los valores predictivos positivos dependen mucho de la prevalencia, pero las razones de verosimilitud son independientes de esta prevalencia, por lo que aúnan las ventajas de la sensibilidad y la especificidad, el hecho de no depender de la prevalencia, y las ventajas de los valores predictivos, el hecho de indicar si la prueba es útil para tomar una decisión clínica.

Hemos visto que en función de qué parámetro empleemos, podríamos elegir un parámetro diferente, pero hay que considerar qué tipo de validez nos da cada parámetro. Las curvas ROC y el índice de Youden nos indican la validez técnica de la prueba, mientras que los valores predictivos y la razón de verosimilitud nos indican la validez clínica, si la técnica nos es útil realmente en la práctica. En este caso, fijaríamos el punto de corte en 110 mg/100 mL, ya que tanto las razones de verosimilitud como la curva ROC y el índice de Youden nos indican que es el valor más adecuado.

¿Y si cambiamos la prevalencia?

En el caso anterior, la prevalencia era del 9,1%, pero si modificamos la prevalencia de la enfermedad al 33,4%, el número de enfermos reales asciende a 23.956. Las tablas de contingencia para cada uno de los tres puntos quedarían así:


Si calculamos el resto de parámetros, vemos que únicamente varían los valores predictivos con respecto al caso anterior, ya que son los únicos que dependen de la prevalencia. En este segundo caso, también elegiríamos el punto de corte de 110 mg/100 mL.

¿Para qué emplearíamos realmente esta prueba?

Generalmente, las pruebas de sobrecarga oral de glucosa no son útiles para el diagnóstico de una diabetes mellitus de tipo I o de tipo II, sino que se suelen preferir los análisis de glucosa en ayunas. Esta prueba se emplea normalmente  para detectar los posibles casos de diabetes mellitus gestacional. Para esta aplicación se le conoce como test de O' Sullivan y no se emplea como prueba diagnóstica sino como cribado. A las embarazadas que den positivo en esta prueba, a continuación se le realizará una prueba diagnóstica, que es la prueba de tolerancia a la glucosa. Esta segunda prueba consiste en medir la glucosa en ayunas, y tras ingerir un preparado con 100 g de glucosa, se determina la glucemia tras 1, 2 y 3 horas.

¿Cómo cambia esto las cosas? Ahora que sabemos que esta prueba no va a ser una prueba diagnóstica sino una prueba de cribado, tenemos que evitar pasar por alto los falsos negativos, tenemos que favorecer la sensibilidad, no puede escapársenos ninguna mujer con diabetes gestacional, pero no nos importa tanto que mujeres que no presenten esta enfermedad den positivo, puesto que vamos a realizar una prueba de confirmación más tarde. 

En esta prueba, queremos que las embarazadas que no tienen diabetes gestacional den negativo, pero que sólo ellas den negativo, por lo tanto, buscaremos un punto de corte que tenga un elevado valor predictivo negativo y una razón de verosimilitud negativa muy baja. En este caso, el punto de corte más adecuado para este uso de la prueba no sería el de 110 mg/100 mL, sino el de 70 mg/100 ml.

En el caso de la diabetes gestacional, es esencial detectar pronto la enfermedad, puesto que puede tener consecuencias, para la madre, pero también para el bebé. Las complicaciones más comunes que puede sufrir la madre son preeclampsia (aumento de la presión arterial que va acompañado de afecciones a otros órganos como el riñón o el hígado) y una mayor probabilidad de padecer diabetes de tipo II en el futuro. Por otro lado, en cuanto al feto, lo que puede ocurrir es un mayor crecimiento, que va a dificultar el parto, un parto prematuro, que va a incrementar la posibilidad de problemas respiratorios en el recién nacido e hipoglucemia del recién nacido, que puede causarle convulsiones. En raras ocasiones, la diabetes gestacional puede provocar la muerte del bebé antes, durante o después del parto.


Si quieres conocer más acerca de la diabetes, puedes consultar la página web de la Federación Española de Diabetes, y ver este vídeo de Eres ciencia


Y si te interesa saber acerca de la diabetes y las investigaciones que se están llevando a cabo en la actualidad, de la mano de uno de los investigadores españoles que trabaja en este campo, te recomiendo escuchar el episodio Las sombras de la diabetes del podcast Noosfera.

Bibliografía empleada

Comentarios