Teorema de Bayes
¡Bayes es mágico!
¿Alguna vez te preguntaste cómo aprenden las computadoras acerca de las personas?
Ejemplo:
Una búsqueda en Internet de "cordones de zapatos automáticos de
películas" muestra "Regreso al Futuro"
¿El motor de búsqueda ha visto la película? No, pero conoce muchas
otras búsquedas sobre lo que la gente probablemente está
buscando.
Y calcula esa probabilidad usando el Teorema de Bayes.
El Teorema de Bayes es una manera de
calcular una probabilidad cuando
conocemos otras ciertas probabilidades.
La fórmula es:
P(A|B) = P(A) P(B|A)P(B)
Lo cual nos dice: | con qué frecuencia sucede A dado que sucede B, escrito como P(A|B), | |
Cuando sabemos: | con qué frecuencia sucede B dado que sucede A, escrito como P(B|A) | |
qué tan probable es A por sí mismo, lo cual se escribe P(A) | ||
y qué tan probable es B por sí mismo, lo cual se escribe P(B) |
Digamos que P(Fuego) significa con qué frecuencia hay fuego, y P(Humo) significa con qué frecuencia vemos humo, entonces:
P (Humo|Fuego) significa con qué frecuencia podemos ver humo cuando hay fuego
Entonces, la fórmula nos dice las cosas "en un sentido" P(Fuego|Humo) cuando conocemos "el sentido contrario" P(Humo|Fuego)
Ejemplo:
- los incendios peligrosos son raros (1%)
- pero el humo es bastante común (10%) debido
a la comida al carbón y a la leña,
- y el 90% de los incendios peligrosos
producen humo
Entonces podemos descubrir la probabilidad de Fuego peligroso cuando hay Humo:
Así que vale la pena echar un vistazo a cualquier humo para estar seguros.
Ejemplo: día de picnic
Estás planeando un picnic hoy, pero la mañana está nublada.- ¡Oh no! ¡El 50% de todos los días lluviosos comienzan nublados!
- Pero las mañanas nubladas son comunes (aproximadamente el 40% de los días comienzan nublados)
- Y este suele ser un mes seco (solo 3 de 30 días tienden a ser lluviosos, o 10%)
Usaremos Lluvia para indicar lluvia durante el día, y Nubes para indicar mañana nublada.
La posibilidad de que ocurra Lluvia si se da Nubes se escribe P(Lluvia|Nubes)
Pongamos eso en la fórmula:
P(Lluvia|Nubes) = P(Lluvia) P(Nubes|Lluvia)P(Nubes)
- P(Lluvia) es la probabilidad de Lluvia = 10%
- P(Nubes|Lluvia) es la probabilidad de Nubes, dado que ocurre Lluvia = 50%
- P(Nubes) es la probabilidad de Nubes = 40%
P(Lluvia|Nubes) = 0.1 x 0.50.4 = .125
O una probabilidad del 12.5% de lluvia. No está mal, ¡hagamos un picnic!
Solo 4 números
Imagina a 100 personas en una fiesta, y que cuentas cuántos visten de rosa o no, y si son hombres o no, y obtienes estos números:
Hagamos algunas cuentas:
Y calculemos algunas probabilidades:
- la probabilidad de ser hombre es P(Hombre) = 40100 = 0.4
- la probabilidad de vestir color rosa es P(Rosa) = 25100 = 0.25
- la probabilidad de que un hombre vista color rosa es P(Rosa|Hombre) = 540 = 0.125
- la probabilidad de que una persona que viste color rosa sea un hombre es P(Hombre|Rosa) = ...
¡Y entonces llega el cachorro! Qué lindo perrito.
¡Y ahora todos tus datos están despedazados! Solo sobreviven 3 valores:
- P(Hombre) = 0.4,
- P(Rosa) = 0.25 and
- P(Rosa|Hombre) = 0.125
¿Puedes hallar P(Hombre|Rosa) ?
Imagina que un invitado que vestía color de rosa olvidó dinero ... ¿fue un hombre? Podemos responder esta pregunta usando el Teorema de Bayes:
P(Hombre|Rosa) = P(Hombre) P(Rosa|Hombre)P(Rosa)
P(Hombre|Rosa) = 0.4 × 0.1250.25 = 0.2
Nota: si todavía tuviéramos los datos sin procesar podríamos calcular directamente 525 = 0.2Generalizando
¿Por qué funciona?Reemplacemos los números con letras:
Ahora veamos las probabilidades. Y tomemos algunas proporciones:
- la probabilidad general de "A" es P(A) = s+ts+t+u+v
- la probabilidad de "B dado A" es P(B|A) = ss+t
Y luego multiplicamos así:
Ahora hagamos eso de nuevo pero usemos P(B) y P(A|B):
Ambas formas obtienen el mismo resultado de ss+t+u+v
Así que podemos ver que:
P(B) P(A|B) = P(A) P(B|A)
Agradable y simétrico, ¿no?En realidad, tiene que ser simétrico, ya que podemos intercambiar filas y columnas y obtener la misma esquina superior izquierda.
Y también es la fórmula de Bayes ... simplemente divide ambos lados por P(B):
P(A|B) = P(A) P(B|A)P(B)
Recordar
Primero piensa "AB AB AB", luego recuerda agruparlo como: "AB = A BA / B"
P(A|B) = P(A) P(B|A)P(B)
¿Alergia a los gatos?
Uno de los usos más famosos del Teorema de Bayes es sobre los Falsos Positivos y Falsos Negativos.
Para aquellos que tenemos dos casos posibles para "A", como Pasar/Fallar (o Sí/No, etc.)
Ejemplo: ¿Alergia o no?
Bianca dice que tiene comezón. Hay una prueba de alergia a los gatos, pero esta prueba no siempre es correcta:- Para las personas que realmente tienen alergia, la prueba dice "Sí" el 80% del tiempo
- Para las personas que no tienen alergia, la prueba dice "Sí" el 10% del tiempo ("falso positivo")
Si el 1% de la población tiene alergia y la prueba de Bianca dice "Sí", ¿cuáles son las posibilidades de que Bianca realmente tenga la alergia?
Queremos saber la posibilidad de tener la alergia cuando la prueba dice "Sí", lo cual escribimos como P(Alergia|Sí)
Usemos la fórmula:
P(Alergia|Sí) = P(Alergia) P(Sí|Alergia)P(Sí)
- P(Alergia) es la probabilidad de tener la alergia = 1%
- P(Sí|Alergia) es la probabilidad de que la prueba diga "Sí" para personas con alergia = 80%
- P(Sí) es la probabilidad de que la prueba diga "Sí" (a cualquiera) = ??%
... pero podemos calcularlo sumando los que tienen y los que no tienen alergia:
- 1% tiene alergia, y la prueba dice "Sí" al 80% de ellos
- El 99% no tiene alergia y la prueba dice "Sí" al 10% de ellos.
P(Sí) = 1% × 80% + 99% × 10% = 10.7%
Lo que significa que aproximadamente el 10.7% de la población obtendrá un resultado "Sí".Entonces ahora podemos completar nuestra fórmula:
P(Alergia|Sí) = 1% × 80%10.7% = 7.48%
P(Alergia|Sí) = about 7%
Este es el mismo resultado que obtuvimos en Falsos Positivos y Falsos Negativos.
De hecho, podemos escribir una versión especial de la fórmula de Bayes solo para cosas como esta:
P(A|B) = P(A)P(B|A) P(A)P(B|A) + P(no A)P(B|no A)
"A" con tres (o más) casos
Acabamos de ver "A" con dos casos (A y no A), de los cuales nos ocupamos en el resultado final.Cuando "A" tiene 3 o más casos, los incluimos todos en la línea de fondo:
P(A1|B) = P(A1)P(B|A1) P(A1)P(B|A1) + P(A2)P(B|A2) + P(A3)P(B|A3) + ...etc
Ejemplo: el concurso de arte tiene participación de tres pintores: Pamela, Pedro y Pablo
- Pamela participa con 15 pinturas, y el 4% de sus obras ha ganado el Primer Premio.
- Pedro participa con 5 pinturas, y el 6% de sus obras ha ganado el Primer Premio.
- Pablo participa con 10 pinturas, y el 3% de sus obras ha ganado el Primer Premio.
¿Cuál es la posibilidad de que Pamela gane el primer lugar?
P(Pamela|Primer) =
P(Pamela)P(Primer|Pamela) P(Pamela)P(Primer|Pamela) + P(Pedro)P(Primer|Pedro) + P(Pablo)P(Primer|Pablo)
Pon los valores:
Multiplica todo por 30 (facilita el cálculo):
Pamela no es la artista más exitosa, pero sí participa con muchas pinturas.
Ahora, de vuelta a los motores de búsqueda.
Los motores de búsqueda toman esta idea y la amplían mucho (además de
algunos otros trucos).
¡Les hace parecer que pueden leer tu mente!
También se puede usar para filtros de correo, servicios de
recomendación de música y más.
¡Refuerza tu aprendizaje resolviendo los siguientes retos sobre este tema! (Nota: están en inglés).