
Ejemplo: ¿alergia o no?
Horacio dice que tiene comezón. Hay una prueba de alergia a los gatos,
pero esta prueba no siempre es correcta:
- Para las personas que realmente tienen alergia, la
prueba dice "Sí" el 80% del tiempo
- Para las personas que no tienen alergia, la prueba
dice "Sí" el 10% del tiempo ("falso positivo")
Aquí está en una tabla:
|
El test dice "Sí" |
El test dice "No" |
Tiene alergia |
80% |
20% "Falso Negativo" |
No tiene alergia |
10% "Falso Positivo" |
90% |
Pregunta: Si el 1% de la población tiene alergia y la
prueba de Horacio dice "Sí", ¿cuáles son las posibilidades de que
Horacio realmente tenga la alergia?
¿Crees que el 75%? ¿O tal vez el 50%?
Una prueba similar se le dio a los médicos y la
mayoría dijeron que alrededor del 75% ...
... pero estaban muy equivocados!
(Fuente: "Razonamiento Probabilístico en Medicina Clínica: Problemas
y Oportunidades" de David M. Eddy 1982, en el que se basa este
ejemplo)
Hay tres formas diferentes de resolver esto:
- "Imagina 1000 personas",
- "Diagramas de árbol" o
- "Teorema de Bayes",
Usa cualquiera que prefieras. Miremos ahora con detalle cada una:
Intenta imaginar a mil personas
Cuando intentes comprender preguntas como esta, imagina un grupo grande
(digamos 1000) y juega con los números:
- De 1000 personas, solo 10 realmente tienen
alergia (1% de 1000 es 10)
- La prueba es 80% correcta para las personas que tienen alergia,
por lo que obtendrá 8 de esos 10 correctos.
- Pero 990 no tienen alergia, y la prueba dirá "Sí"
al 10% de ellos,
que son 99 personas a las que dice "Sí" erróneamente
(falso positivo)
- Entonces, de 1000 personas, la prueba dice "Sí" a
(8 + 99) = 107 personas
Veamos todo en una tabla:
|
1% son alérgicos |
El test dice "Sí" |
El test dice "No" |
Tiene alergia |
10 |
8 |
2 |
No tiene alergia |
990 |
99 |
891 |
|
1000 |
107 |
893 |
Entonces, 107 personas obtienen un "Sí", pero solo 8 de ellos realmente
tienen alergia:
8 / 107 = aproximadamente 7%
Entonces, a pesar de que la prueba de Horacio decía "Sí", apenas es solo
un
7% probable que Horacio tenga una alergia a los gatos.
¿Por qué tan pequeña la probabilidad? Bueno, la alergia es tan rara que
aquellos que realmente la tienen se ven
ampliamente superados por
aquellos con un falso positivo.
Como un diagrama
Dibujar un diagrama de
árbol puede ser de mucha ayuda:

Antes que nada, verifiquemos que todos los porcentajes suman lo
correcto:
0.8% + 0.2% + 9.9% + 89.1% = 100% (¡bien!)
Y las dos respuestas "Sí" se suman 0.8% + 9.9% = 10.7%, pero
solo 0.8% son correctas.
0.8/10.7 = 7% (misma respuesta anterior)
Teorema de Bayes
Teorema de Bayes tiene una fórmula
especial para este tipo de cosas:
P(A|B) = P(A)P(B|A)
P(A)P(B|A) + P(no A)P(B|no A)
donde:
- P significa "Probabilidad de"
- | significa "dado que"
- A en este caso es "en realidad tiene alergia"
- B en este caso es "la prueba dice Sí"
Por lo tanto:
P(A|B) significa "La probabilidad de que Horacio realmente
tenga la alergia dado que la prueba dice Sí"
P(B|A) significa "La probabilidad de que la prueba indique Sí,
dado que Horacio en realidad tiene alergia"
Para ser más claros, cambiemos A por tiene (en
realidad tiene alergia) y B por Sí (la prueba dice
que sí):
P(tiene|Sí) = P(tiene)P(Sí|tiene)
P(tiene)P(Sí|tiene) + P(no tiene)P(Sí|no tiene)
Sustituyamos los valores:
P(tiene|Sí) = 0.01×0.8
0.01×0.8 + 0.99×0.1
= 0.0748...
Que es aproximadamente el 7%
Obtén más información sobre esto en Teorema
de Bayes.
Un último ejemplo
Ejemplo extremo: un virus informático

Un virus informático se propaga por todo el mundo, todos informando a
una computadora principal.
Los buenos capturan la computadora principal y descubren que un millón
de computadoras han sido infectadas (pero no saben cuáles).
¡Los gobiernos deciden tomar medidas!
Nadie puede usar Internet hasta que su computadora pase la prueba
"libre de virus". La prueba es 99% precisa (bastante buena, ¿verdad?)
Pero el 1% de las veces dice que tiene el virus cuando no lo tiene (un
"falso positivo").
Ahora digamos que hay 1000 millones de usuarios de
internet.
- De 1 millón con el virus, el 99% de ellos están
prohibidos correctamente = aproximadamente 1 millón
- Pero los falsos positivos son 999 millones x 1% = aproximadamente
10 millones
Entonces, se prohibió un total de 11 millones, pero
solo 1 de esos 11 en realidad tiene el virus.
Entonces, si te bloquearan el internet, ¡solo habría un 9% de
posibilidades de que tengas el virus!
Conclusión
Al tratar con falsos positivos y falsos negativos (u otras preguntas de
probabilidad difíciles) podemos usar estos métodos:
- "Imaginar 1000 personas",
- "Diagramas de árbol" o
- "Teorema de Bayes",
¡Refuerza tu aprendizaje resolviendo los siguientes retos sobre este
tema! (Nota: están en inglés).
3109,3110,3111,3112,3113,3114,3837,3838,3839,3840
Copyright © 2024 Rod Pierce