Las pruebas diseñadas para establecer la presencia o ausencia de una condición determinada nunca son perfectas. Por ejemplo, podríamos querer hacer un test médico para la presencia o ausencia de una enfermedad determinada, que sea positiva en las personas con la enfermedad y negativa en las personas que no la tienen. Desafortunadamente, el caso habitual es que en ocasiones una persona con la enfermedad puede tener un test negativo, y una persona que no la ha tenido puede tener un resultado positivo.
El grado de corrección en el resultado de un test puede ser evaluado mediante el cálculo de su sensibilidad, especificidad, valor predictivo positivo y valor predictivo negativo. Usaremos la tabla siguiente para explicar estos conceptos.
Imaginemos que queremos evaluar un nuevo test de COVID-19. Para ello, pasamos el test a 35.000 personas, de las cuales sabemos previamente con certeza al 100% que hay 700 enfermas (E) y 34.000 sanas (no E).
En la tabla, un «+» indica un resultado positivo en el test y un «–» indica un resultado negativo en el test; E indica que tiene la enfermedad y no E significa que no tiene la enfermedad.
E | no E | Total | |
---|---|---|---|
+ | 525 | 350 | 875 |
– | 175 | 33.950 | 34.125 |
Total | 700 | 34.300 | 35.000 |
Los resultados indican que de las 700 personas enfermas, el test ha identificado correctamente a 525 como positivas, pero ha dado un resultado erróneo en 175. De la misma forma, el test ha dado resultado erróneo identificando como enfermas a 350 personas sanas. Las personas enfermas pero que el test identifica erróneamente como no enfermas, se conocen como falsos negativos, en nuestro caso, 175. Los casos que el test identifica como positivos, pero que en realidad no lo son, son los falsos positivos, en nuestro caso, 350.
En términos de porcentajes, nuestra tabla sería la siguiente:
E | no E | Total | |
---|---|---|---|
+ | 1,5% | 1% | 2,5% |
– | 0,5% | 97% | 97,5% |
Total | 2% | 98% | 100% |
En estadística, los resultados no se suelen expresar en porcentajes, sino en términos de probabilidad, como valores entre 0 y 1, donde 1 significa el hecho cierto que ocurre siempre y 0 significa el hecho falso que no ocurre nunca. En la práctica, y de forma coloquial, podemos asociar los valores de probabilidad a porcentajes multiplicando por 100, es decir, comparando frente a 100 en vez de frente a 1.
Según esto, podemos ver que el 0,015 de la población (1,5%) tiene la enfermedad y ha dado positivo en el test, mientras que el 0,970 de la población (97,5%) no tiene la enfermedad y ha dado negativo.
E | no E | Total | |
---|---|---|---|
+ | 0,015 | 0,010 | 0,025 |
– | 0,005 | 0,970 | 0,975 |
Total | 0,020 | 0,980 | 1,000 |
Ahora tenemos elementos para establecer cuatro indicadores importantes para nuestro test.
La sensibilidad es la probabilidad (o proporción) de que una persona con la enfermedad dé un resultado positivo en el test. En nuestro caso, Sensibilidad = 0,015 / 0,020 = 0,75. Es decir, nuestro test identifica correctamente al 75% de los casos, pero en un 25% de los casos obtendremos un resultado negativo y realmente la persona está enferma.
La especificidad es la probabilidad de que una persona que no tiene la enfermedad dé un resultado negativo en el test. En nuestro caso, Especificidad = 0,97 / 0,98 = 0,99. En nuestro ejemplo, si no tienes la enfermedad, estamos casi seguros (pero no totalmente) de que el test producirá un resultado negativo.
El valor predictivo positivo es la probabilidad de que una persona que da positivo en el test tenga realmente la enfermedad. En nuestro caso VPP = 0,015 / 0,025 = 0,60. En nuestro caso, esto quiere decir que si la persona tiene un resultado positivo en el test, la probabilidad de que realmente tenga la enfermedad es sólo del 60%
El valor predictivo negativo es la probabilidad de que una persona que da negativo en el test realmente no tenga la enfermedad. en nuestro caso, VPN = 0,970 / 0,975 = 0,99. En nuestro caso, esto quiere decir que si una persona da negativo en el test, es casi seguro que no tiene la enfermedad (99%)
Finalmente, la prevalencia es simplemente la probabilidad de que una persona tenga la enfermedad, en este caso 0,02 (2%)
Cuando se diseña un nuevo test, es necesario establecer todos estos indicadores antes de su puesta en circulación, para asegurarse de que en primer lugar cumple correctamente la finalidad para la que se ha diseñado, y en segundo lugar, conocemos con exactitud los posibles errores en los que podemos incurrir. Por esta razón, en las fases de desarrollo, se realizan experimentos complejos con números suficientes de individuos que permitan conocer estos indicadores con la mayor precisión.