Story Transcript
Dos aplicaciones de Bayes en el campo de la medicina Juana Elisa Escalante Vega. Adriana Laura López Lobato. Abraham Cuesta Borges.
Facultad de Estadistica e Informática. Facultad de Matemáticas. Facultad de Economía. Lomas del Estadio S/N Zona Universitaria Xalapa Ver. C.P. 91000 México Resumen
La enseñanza de la probabilidad en la actualidad se hace cada vez más necesaria ya que se utiliza en la vida cotidiana. El uso de ejemplos prácticos es utilizado en este artículo como una estrategia de enseñanza ya que permiten estimular a los alumnos en la construcción y/o reconstrucción de algunos de los conceptos básicos de la teoría de la probabilidad. Bayes nos permite realizar un proceso mediante el cual encontramos la hipótesis más probable. Esta capacidad para realizar deducciones para la toma de decisiones a partir de situaciones específicas ha llamado la atención en muchas disciplinas. En el presente trabajo se presentarán unas de las aplicaciones más intuitivas del Teorema de Bayes: el diagnóstico médico y las pruebas diagnósticas. Abstract
The teaching of probability now becomes increasingly necessary as it is used in everyday life. Using practical examples is used in this article as a teaching strategy as they allow students to encourage the construction and / or reconstruction of some of the basic concepts of probability
theory. Bayes allows us to carry out a process by which we find the most likely scenario. This ability to make inferences for decision making from specific situations has attracted attention in many disciplines. Medical diagnosis and diagnostic tests: In this paper some of the most intuitive application of Bayes Theorem is presented.
Palabras Clave Teorema de Bayes, Sensibilidad, especificidad, prevalencia, probabilidad condicional, causal.
Keywords Bayes Theorem, sensitivity, specificity, prevalence, conditional probability.
Introducción En la actualidad los estudiantes se encuentran frecuentemente con el Teorema de Bayes, también llamado Teorema de las causas, y no sólo estudiantes de Ciencias Matemáticas o Informática, sino de cualquier disciplina científica (Mosqueda, 2008). Después de más de dos siglos de controversia, este teorema ha tenido un gran impacto en la inferencia estadística. Hoy por hoy son conocidas sus innumerables aplicaciones en muchas ramas de la ciencia como: genética, lingüística, procesamiento de imágenes, epidemiología, psicología, ciencia forense, ecología, medicina, entre otras (Marasco, 2011), (V. Stone, 2013), ya que nos brinda la capacidad de inferir la probabilidad de una causa cuando se ha observado su efecto. En este trabajo se presentarán unas de las aplicaciones más intuitivas del Teorema de Bayes: el diagnóstico médico y las pruebas diagnósticas, ya que es una excelente herramienta que nos permite estimar probabilidades causales, es decir, saber cuál es la probabilidad de tener una enfermedad, basándose en los síntomas presentados, o mediante pruebas diagnósticas, a partir de la prevalencia, sensibilidad y especificidad (Wikipedia, 2014) de las mismas. Pruebas diagnosticas A continuación se presenta una situación donde se usa una prueba diagnóstica para detectar la presencia de un parasito muy peligroso en personas de una población.
Supongamos que se hace un análisis en una población Especificidad: La especificidad
con un total de 10,000 personas para detectar la
nos indica la capacidad de
presencia de un parásito en humanos,
nuestro estimador para dar
Dentro de esta población solo el 2%, o un total de 200
como
casos
casos
realmente sanos;
personas, tienen este parásito. Este 2% representa la
decir,
prevalencia de la presencia del parásito en la población.
la
negativos
los es
especificidad
caracteriza la capacidad de la
En consecuencia el 98% de las personas no tienen el
prueba
parásito.
ausencia de la enfermedad en
A 100 personas se le aplica una prueba que detecta la
para
detectar
la
sujetos sanos. 𝐸𝑠𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑖𝑑𝑎𝑑 =
presencia del parásito y 80 de los 100 enfermos tienen
𝑉𝑁 𝑉𝑁 + 𝐹𝑃
un resultado positivo, entonces la prueba tiene una sensibilidad del 80%, La tasa de equivocaciones del 2% se obtiene de realizar el cálculo 100-sensibilidad, entonces esas dos personas que tiene la enfermedad tendrán un resultado negativo. Si la prueba tiene una especificidad del 80%, la tasa de falsas alarmas de la prueba es del 20%, es decir, fuera de las 9,800 personas que no tienen la enfermedad, 198 de ellas tendrán una prueba positiva, En la siguiente tabla se observan, de manera resumida, las probabilidades mencionadas anteriormente:
Sensibilidad:
La
sensibilidad nos indica la capacidad del estimador para dar como casos positivos
los
Probabilidad de que:
𝑃
La persona tiene el parasito
𝑄
La persona no tiene el parasito
Q=1-P=.98
𝑆
Sensibilidad de la prueba de la
S=.80
caracteriza
Valor P=.02
presencia del parasito
casos
realmente enfermos, es decir,
Variable
𝐸
Especificidad de la prueba
E=.80
la
capacidad de la prueba para
detectar
enfermedad personas
en que
enfermas.
𝑆𝑒𝑛𝑠𝑖𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑉𝑃 = 𝑉𝑃 + 𝐹𝑁
la las están
Aplicando el teorema de Bayes (V. Stone, 2013) podemos calcular la probabilidad de que una persona tenga realmente el parasito cuando la prueba dio positivo sustituyendo los datos anteriores en la siguiente fórmula:
𝑃(𝑒𝑛𝑓𝑒𝑟𝑚𝑒𝑑𝑎𝑑|𝑇 +) =
(0.02)(0.8) 𝑃∙𝑆 = = 0.0754717 (0.02)(0.8) 𝑃 ∙ 𝑆 + 𝑄(1 − 𝐸) + (0.98)(1 − 0.8)
Obtenemos una probabilidad de 0.0754717, o lo que es lo mismo ¡cerca del 88% de los positivos obtenidos en la prueba son realmente falsos positivos! Esto inicialmente choca con nuestra intuición, ¿cómo puede ser que una prueba con una sensibilidad y especificidad altas parezca tan mala en la práctica? El problema radica en el valor de la prevalencia, que es muy bajo y si se refiere a la población general. Probablemente no será aplicable a un sujeto que acude a consulta a un hospital y al que se le realiza la prueba porque hay otros motivos de sospecha −porque pertenece a un grupo de riesgo, porque presenta síntomas específicos...− y entonces ya no es aplicable la prevalencia de la población general, sino la del subgrupo de población al que pertenece y en el que la prevalencia (probabilidad a priori) de padecer la enfermedad será radicalmente mayor. Sin embargo los cálculos sí que son válidos si estamos pensando en la población general, por ejemplo porque valoramos la posibilidad de plantear un programa de "diagnostico " este habrá que considerar entonces el coste social, personal y económico que supone el tener un gran número de falsos positivos (Marasco, 2011), frente al beneficio de detectar verdaderos enfermos, no vaya ocurrir que sea el propio diagnóstico el que cree una epidemia. Partiendo de esta aplicación del Teorema de Bayes, que en esencia es un razonamiento plasmado en una fórmula (V. Stone, 2013) que nos permite, como en el ejemplo anterior, modificar la probabilidad conocida de que ocurra un suceso cuando tenemos nueva información al respecto.
Ejemplo de diagnóstico médico (Diabetes-Insuficiencia venosa)
Datos estadísticos: Probabilidades de Diabetes: Las probabilidades dependen de la edad, ya que esto dirá qué tipo de diabetes se puede tener: Tipo 1 (Juvenil) o Tipo 2 (Adultos) Diabetes (Tipo 1)- Prevalencia: 0.5% antes de los 40 (Poco frecuente) Diabetes (Tipo 2)-Prevalencia: 3.7% después de los 40 (Abarca el 80% de los casos de diabetes). Probabilidades de la Insuficiencia venosa crónica: (Afección en la cual las venas tienen problemas para retornar la sangre de las piernas al corazón.)
Tiene una prevalencia del 40% en hombres y 32% en mujeres. Ambas enfermedades presentan como síntoma la aparición de úlcera o llagas en los tobillos. El 60% de las personas con diabetes desarrollan problemas de úlceras o llagas en las piernas. El 4% de la población con insuficiencia venosa crónica tiene una ulceración cicatrizada o activa en las piernas. En la población general el 2.1% de personas presentan úlceras o llagas en los tobillos. Perspectiva del paciente Supongamos que un día Marcos se da cuenta que tiene úlceras o llagas en los tobillos. Ese mismo día va a consulta con su doctor y éste le dice que el 60% de los hombres de su edad que tienen diabetes presentan los mismos síntomas, es decir la probabilidad de tener estos síntomas dado que tienes diabetes es de 0.6 (es decir 60%). Después de pensarlo un momento Mario se da cuenta que no quieres saber cuál es la probabilidad de tener dichos síntomas dado que tiene diabetes, sino lo contrario, ¿cuál es la probabilidad de tener diabetes dado que tiene dichos síntomas? Cuando le haces dicha pregunta al doctor, él realiza algunos cálculos y te dice: “la probabilidad de que tenga viruela dado que tiene dichos síntomas es de 0.1428 (14.28%).” Ésta es la información relevante y nos muestra el contraste entre la probabilidad de los síntomas dada una enfermedad (con la que no se puede trabajar) y la probabilidad de la enfermedad dados los síntomas (que es lo que queremos saber). Perspectiva del doctor Ahora supongamos que eres el doctor y tienes que diagnosticar a una persona que presenta úlceras en los tobillos. Los síntomas del paciente son consistentes con la Insuficiencia venosa, pero también son consistentes con otra enfermedad más peligrosa, la diabetes. Entonces tienes un dilema ¿cuál enfermedad es más probable que tenga el paciente? Sabemos que el 60% de las personas con diabetes tiene úlceras en los tobillos, además el 4% de las personas con insuficiencia venosa presentan dichas llagas. Entonces la probabilidad (0.6) de los síntomas dado que el paciente tiene diabetes es mayor a la probabilidad (0.04) de los síntomas dado que el paciente tiene insuficiencia venosa. ¿Ésta información basta para asegurar que el paciente tiene diabetes y no insuficiencia venosa? Un doctor con experiencia limitada podría pensar que sí, pero un doctor experto sabe que la diabetes no es tan común en hombres de la edad de Mario, lo mismo sucede con la insuficiencia venosa. Este conocimiento es llamado información a priori, y puede ser utilizado para decidir cuál es la enfermedad que probablemente tenga el paciente. Veamos esta perspectiva con números.
Perspectiva del doctor (Con cálculos) Se pueden utilizar probabilidades asociadas con alguna enfermedad al hacer uso de las estadísticas de salud públicas, suponiendo que los doctores reportan el número de casos de ulceras e insuficiencia venosa, y los síntomas observados. Haciendo uso de estos estudios o encuestas encontramos que la probabilidad de que un paciente tenga úlceras dado que tiene insuficiencia venosa es del 4% (0.04). Podemos escribir esto de la siguiente manera: 𝑃(Ú𝑙𝑐𝑒𝑟𝑎𝑠|𝐼𝑛𝑠𝑢𝑓𝑖𝑐𝑖𝑒𝑛𝑐𝑖𝑎 𝑉𝑒𝑛𝑜𝑠𝑎) = 0.04 “La probabilidad de que el paciente tenga úlceras dado que tiene insuficiencia venosa es de 0.04” Esto es, la probabilidad de tener úlceras se dice que es condicional a la enfermedad en consideración. Por esta razón dichas probabilidades son conocidas como probabilidades condicionales. Del mismo modo encontramos que las úlceras son observadas en el 60% de pacientes que tienen diabetes. Lo escribimos como: 𝑃(Ú𝑙𝑐𝑒𝑟𝑎𝑠|𝐷𝑖𝑎𝑏𝑒𝑡𝑒𝑠) = 0.6 Como nomenclatura: Sea 𝑃(Ú𝑙𝑐𝑒𝑟𝑎𝑠|𝐼𝑛𝑠𝑢𝑓𝑖𝑐𝑖𝑒𝑛𝑐𝑖𝑎 𝑉𝑒𝑛𝑜𝑠𝑎) la probabilidad condicional de que el paciente tenga erupciones dado que tiene IV, llamémosla verosimilitud de la IV, y del mismo modo 𝑃(Ú𝑙𝑐𝑒𝑟𝑎𝑠|𝐷𝑖𝑎𝑏𝑒𝑡𝑒𝑠) es la verosimilitud de la Diabetes. Entonces la verosimilitud de la diabetes es mayor que la de la IV. Dado que solo hay dos enfermedades bajo consideración, la diabetes tiene la máxima verosimilitud. La enfermedad con mayor valor de verosimilitud es conocida como Máxima Verosimilitud Estimada de la enfermedad que el paciente tiene, por lo que en este caso la Diabetes es la Máxima Verosimilitud Estimada. Ahora ¿cómo debemos combinar la experiencia previa con la evidencia (síntomas)? Desde una perspectiva intuitiva, un doctor experimentado sabe que la probabilidad de que el paciente de la edad de Mario es intrínsecamente poco probable debido a que se trata de una enfermedad en la cual el 80% de los casos son pacientes de más de 40 años. Por ejemplo, supongamos que las estadísticas de salud pública informan que la prevalencia de la diabetes en la población general es de 0.005, es decir que 5 en mil posibilidades de que una persona elegida al azar de la edad de Mario tenga diabetes. Entonces, la probabilidad de que un individuo elegido al azar, que sea menor de 40 años, tenga Diabetes es 𝑃(𝐷𝑖𝑎𝑏𝑒𝑡𝑒𝑠) = 0.005
Esto representa el conocimiento a priori sobre la enfermedad en la población, antes de que observemos al paciente y es conocido como la probabilidad a priori de que cualquier individuo menor de 40 años tenga diabetes. Como el paciente, antes de observar sus síntomas, es propenso a tener diabetes como cualquier otro individuo, sabemos que la probabilidad a priori de que tenga diabetes es 0.005. Utilizando la Regla de Bayes para el caso de la diabetes es:
𝑃(𝐷𝑖𝑎𝑏𝑒𝑡𝑒𝑠|Ú𝑙𝑐𝑒𝑟𝑎𝑠) =
𝑃(Ú𝑙𝑐𝑒𝑟𝑎𝑠|𝐷𝑖𝑎𝑏𝑒𝑡𝑒𝑠)𝑥𝑃(𝐷𝑖𝑎𝑏𝑒𝑡𝑒𝑠) 𝑃(Ú𝑙𝑐𝑒𝑟𝑎𝑠)
Donde el término 𝑃(Ú𝑙𝑐𝑒𝑟𝑎𝑠) se refiere a la proporción de personas de la población en general que tiene úlceras y por lo tanto representa la probabilidad de que al elegir al azar a una persona en la población ésta tenga úlceras en los tobillos. Asumamos que 𝑃(Ú𝑙𝑐𝑒𝑟𝑎𝑠) = 0.021, es decir que 21 de cada 1000 individuos tienen úlceras en los tobillos. Entonces al sustituir los números en la Regla de Bayes tenemos que:
𝑃(𝐷𝑖𝑎𝑏𝑒𝑡𝑒𝑠|Ú𝑙𝑐𝑒𝑟𝑎𝑠) =
0.6 𝑥 0.005 0.021
𝑃(𝐷𝑖𝑎𝑏𝑒𝑡𝑒𝑠|Ú𝑙𝑐𝑒𝑟𝑎𝑠) = 0.1428571 Que es la probabilidad condicional (a posteriori) de que el paciente tenga Diabetes dado que presenta como síntoma úlceras en los tobillos. Entonces haciendo uso de la experiencia previa transformamos la probabilidad condicional de los síntomas observados dada una enfermedad (verosimilitud) a una probabilidad condicional más útil: la probabilidad de que el paciente tiene cierta enfermedad dado síntomas particulares (probabilidad a posteriori). En esencia la Regla de Bayes es utilizada para combinar experiencia previa (probabilidad a priori) con datos observados (verosimilitud) para combinar estos datos (en la forma de probabilidad a posteriori). Este proceso es conocido como inferencia bayesiana. Inferencia La inferencia bayesiana no garantiza la provisión de la respuesta correcta. Sólo muestra la probabilidad de cada una de las respuestas alternativas. La inferencia bayesiana podría hacernos llegar a resultados erróneos, pero es menos errónea (V. Stone, 2013) que cualquier otro método de abducción.
Realizando un diagnóstico Para realizar un diagnóstico es necesario saber las probabilidades posteriores de cada enfermedad a considerar. Ya que contamos con dichas probabilidades se comparan con el fin de elegir la enfermedad que es más probable dados los síntomas observados. Supongamos que la prevalencia de la Insuficiencia Venosa (IV) en la población en general es de 0.4. Esta representa nuestro conocimiento previo sobre la IV antes de que observemos cualquier síntoma del paciente, es decir: 𝑃(𝐼𝑉) = 0.4 “La probabilidad a priori de la IV” Del mismo modo que con la Insuficiencia Venosa utilizamos la Regla de Bayes y obtenemos que
𝑃(𝐼𝑉|Ú𝑙𝑐𝑒𝑟𝑎𝑠) =
𝑃(Ú𝑙𝑐𝑒𝑟𝑎𝑠|𝐼𝑉)𝑥 𝑃(𝐼𝑉) 𝑃(Ú𝑙𝑐𝑒𝑟𝑎𝑠)
𝑃(𝐼𝑉|Ú𝑙𝑐𝑒𝑟𝑎𝑠) =
0.04 𝑥 0.4 0.021
𝑃(𝐼𝑉|Ú𝑙𝑐𝑒𝑟𝑎𝑠) = 0.7619 Por lo tanto las probabilidades a posteriori son: 𝑃(𝐷𝑖𝑎𝑏𝑒𝑡𝑒𝑠|Ú𝑙𝑐𝑒𝑟𝑎𝑠) = 0.1428571 𝑃(𝐼𝑉|Ú𝑙𝑐𝑒𝑟𝑎𝑠) = 0.7619048 Donde notamos que no podemos asegurar que el paciente tenga IV, pero tenemos la certeza de que hay un 76.19% de probabilidad de que la tenga. Si hubiéramos ignorado el conocimiento previo y solo hubiéramos utilizado las verosimilitudes para decidir cómo diagnosticar al paciente éstas nos habrían llevado tal vez a la conclusión de que padecía diabetes. La fórmula utilizada para llegar a la inferencia bayesiana es la Regla de Bayes:
𝑃 𝑝𝑜𝑠𝑡𝑒𝑟𝑖𝑜𝑟𝑖 =
𝑉𝑒𝑟𝑜𝑠𝑖𝑚𝑖𝑙𝑖𝑡𝑢𝑑 𝑥 𝑃 𝑎 𝑝𝑟𝑖𝑜𝑟𝑖 𝑉𝑒𝑟𝑜𝑠𝑖𝑚𝑖𝑙𝑖𝑡𝑢𝑑 𝑚𝑎𝑟𝑔𝑖𝑛𝑎𝑙
Donde la verosimilitud marginal es también conocida como evidencia. En la siguiente tabla se aprecian, de manera resumida, las probabilidades necesarias para obtener las probabilidades condicionales a posteriori deseadas al realizar el diagnóstico. Insuficiencia Venosa
Diabetes
Verosimilitud
𝑃(Ú𝑙𝑐𝑒𝑟𝑎𝑠|𝐼𝑉) = 0.04
𝑃(Ú𝑙𝑐𝑒𝑟𝑎𝑠|𝐷𝑖𝑎𝑏𝑒𝑡𝑒𝑠) = 0.6
Probabilidad a priori
𝑃(𝐼𝑉) = 0.4
𝑃(𝐷𝑖𝑎𝑏𝑒𝑡𝑒𝑠) = 0.005
Verosimilitud marginal
𝑃(Ú𝑙𝑐𝑒𝑟𝑎𝑠) = 0.021
𝑃(Ú𝑙𝑐𝑒𝑟𝑎𝑠) = 0.021
Probabilidad condicional a posteriori
𝑃(𝐼𝑉|Ú𝑙𝑐𝑒𝑟𝑎𝑠) 𝑃(Ú𝑙𝑐𝑒𝑟𝑎𝑠|𝐼𝑉)𝑃(𝐼𝑉) = 𝑃(Ú𝑙𝑐𝑒𝑟𝑎𝑠) = 0.7619048
𝑃(𝐷𝑖𝑎𝑏𝑒𝑡𝑒𝑠|Ú𝑙𝑐𝑒𝑟𝑎𝑠) = 𝑃(Ú𝑙𝑐𝑒𝑟𝑎𝑠|𝐷𝑖𝑎𝑏𝑒𝑡𝑒𝑠)𝑃(𝐷𝑖𝑎𝑏𝑒𝑡𝑒𝑠) = 𝑃(Ú𝑙𝑐𝑒𝑟𝑎𝑠) = 0.1428571
Resultado
Hay una probabilidad del Hay una probabilidad del 14.28% de que el paciente 76.19% de que el paciente tenga tenga Diabetes dado que tiene úlceras de los tobillos. Insuficiencia Venosa dado que tiene úlceras de los tobillos.
Conclusiones Para que el protocolo de diagnóstico sea razonable, el médico debe de emplear el método científico, utilizar datos históricos, es decir el historial y los síntomas del paciente, ser simple y fácil de explicar, por lo que el mejor candidato para la realización de dicho protocolo es el Teorema de Bayes, ya que nos permite tomar datos estadísticos que representen el historial y los síntomas del paciente y trabajar con ellos de tal manera que se obtendrán las verosimilitudes necesarias para realizar el diagnóstico. En la siguiente tabla resumimos la relación entre método científico y el protocolo médico
El Método Científico
Protocolo del diagnóstico
1. Se valida la Teoría de Probabilidad inicial.
1. Estimación realizada por el médico de la probabilidad de la enfermedad basándose en el historial y los síntomas del paciente.
2. Realización del experimento
2. Realización de una prueba diagnóstica.
3. Los resultados confirman o refutan la teoría.
3. El resultado de la prueba es positivo o negativo.
4. Actualización: La nueva teoría de la probabilidad es válida y depende de la probabilidad inicial, el resultado experimental y la fuerza del experimento.
4. Actualización: Nueva estimación de la probabilidad de la enfermedad sobre la base de la estimación anterior, resultado de la prueba y la fuerza de ensayo.
5. La nueva probabilidad se convierte en la probabilidad inicial para el siguiente ciclo.
5. La nueva estimación es ahora el punto de partida para la siguiente prueba, en caso de ser necesaria.
6. Regrese a 1 (enfoque iterativo)
6. Ir a 2, si es necesario.
La probabilidad debe ser vista como un conjunto de ideas y procedimientos que permiten aplicar la matemática en hechos de la vida cotidiana, ya que está nos permite determinar e identificar conjuntos de datos o informaciones que no pueden ser cuantificadas en forma directa o exacta. Por otro lado consideramos que: la resolución de problemas debe ser considerada como la principal estrategia para la enseñanza de la matemática. Tal como considera Van de Walle (2007) “las evidencias tienden a mostrar que la resolución de problemas es una poderosa y eficaz herramienta para el aprendizaje”, más aún si estos problemas están relacionados con situaciones cotidianas.
Bibliografía Van de Walle, J. A. (2007) Elementary and middle school mathematics: teaching developmentally 6th Edition, Boston: Pearson. V. Stone, James. (2013) Bayes ‘Rule, A tutorial introduction to Bayesian Analysis. Marasco, J., Doerfler, R. (2011) Doc, what are my chances?, The UMAP Journal. Mosqueda, J., Salcedo, A. (2008), Didactica del Álgebra Lineal y la Probabilidad, Caracas.