Mejorando nuestras creencias: El Teorema de Bayes

1*eWJJ8_TXW4kLpEM5fLx6ng.jpeg

Cómo tomar mejores decisiones en situaciones de incertidumbre. Parte 2

En el artículo “Moldeando la Incertidumbre”, la primera parte de la serie Cómo tomar mejores decisiones en momentos de incertidumbre, le pedí a los lectores que se imaginen viviendo una situación en la que tienen que decidir si el renunciar a su trabajo para embarcarse en lo que parece una atractiva oportunidad de negocio es la decisión correcta. Empleamos el modelo de la Utilidad Subjetiva Esperada (USE) y determinamos que en este ejemplo, aventurarse en este nuevo proyecto era la alternativa con la mayor utilidad. En otras palabras, basados en nuestra estimación subjetiva de las probabilidades y los resultados, podemos determinar la decisión que nos traerá mayor satisfacción [i].

Evidentemente, ser capaz de predecir probabilidades de manera correcta es un requisito fundamental cuando se usa el método USE. En términos prácticos esto significa que un mal cálculo de probabilidades puede llevarnos a tomar costosas e incorrecta decisiones. Sin embargo, a pesar de su crítica importancia no es obvio el cómo poder mejorar nuestras habilidades de cálculo de probabilidades.

Por lo tanto, este capítulo desarrollará con mayor profundidad nuestras herramientas para la mejora de toma de decisiones explicando el siguiente conceptos clave: El Teorema de Bayes.

El Teorema de Bayes

La vida nos alimenta con una imparable corriente de nuevos eventos y piezas de información que nos permite actualizar nuestras creencias sobre el mundo.

Estos hechos se convierten en evidencia invaluable que debería ser usada para mejorar la calidad de nuestros juicios de valor; sin embargo su adecuado uso es más contraintuitivo de lo que podrías esperar. Por ejemplo, supón que estás en una fiesta y conoces a una persona llamada X, quien te está coqueteando. ¿Sabes cómo determinar si esa persona quiere tener un amorío contigo?

Imagino que encuentras esta pregunta intrigante porque aunque se trata de una situación bastante mundana, responderla con precisión no es tan sencillo. Afortunadamente, hay una manera para resolver esta clase de problemas: El Teorema de Bayes.

 

1*_76AG152Gzd1TpEoiG2_Tg.png

Figura 1: El Teorema de Bayes

Esta fórmula (Figura 1) nos permite determinar la probabilidad de ocurrencia de una hipótesis dada la presencia de nueva evidencia. Aún más, es la representación matemática de una manera de pensar que puede mejorar nuestro entendimiento sobre la relación entre lo que sabemos y lo que se revela ante nosotros. Y en la práctica, puede dramáticamente enriquecer la calidad de las decisiones que tomamos.

El Teorema de Bayes es indudablemente una de las más importantes herramientas con la que contamos los humanos cuando necesitamos reducir la incertidumbre. Entre muchos otros ejemplos, ha sido usado para determinar la probabilidad de tener una condición médica dado un test con resultado positivo [1], el ganador de elecciones políticas [2], mejorar el desempeño del aprendizaje automático de computadoras [3] y hasta incluso para intentar “demostrar” tanto la existencia [4] como la inexistencia [5] de Dios.

Tomando en cuenta su importancia me parece muy extraño que el pensamiento Bayesiano no haya alcanzando una difusión masiva; siendo principalmente relegado al mundo de los matemáticos, filósofos y estadistas. Pienso que la principal razón para esta falta de popularidad se puede encontrar en dificultad para comprender su mecanismo. Aunque hay muchas fuentes con explicaciones muy sólidas y extensas del Teorema de Bayes, no he encontrado ninguna lo suficientemente concreta, intuitiva y adaptable. Aquí trataré de llenar ese vacío.

Diseccionando a Bayes

El poderoso Teorema de Bayes es simplemente una “prueba de fuerza” entre dos hipótesis en competencia, con el objetivo de determinar sus probabilidades de ocurrencia a la luz de nueva evidencia. Usar su fórmula es mucho más fácil de lo que parece. Para ello, dividámosla en las partes que la conforman [ii].

  • La hipótesis con la que empezamos, llamada la probabilidad a priori, es representada por la letra H.
  • La nueva evidencia es representada por la letra E.
  • La probabilidades de ocurrencia se representan con la letra p seguida por un paréntesis.
  • El signo “|” significa dado (de la acepción de causa o razón).
  • Lo que queremos conocer es la probabilidad a posteriori p(H|E), es decir la probabilidad de ocurrencia de una hipótesis H dada la evidencia E.
  • p(E|H) es la probabilidad de ocurrencia de la evidencia E dada la hipótesis H. Dicho de otra manera, “si la hipótesis es cierta, qué tan esperada es la evidencia”.
  • ~H es la hipótesis que compite con hipótesis H. Estas hipótesis son complementarias, es decir ~H significa no H. Por lo tanto, al sumar las probabilidades de H y ~H debemos obtener siempre un valor de 1 (o su equivalente 100%).
  • p(E|~H) es la probabilidad de ocurrencia de la evidencia E dada la hipótesis que compite con H. Dicho de otra manera, “si la otra hipótesis es cierta, qué tan esperada es la evidencia”.

La Tabla de Fuerza de las Hipótesis

Ahora que conocemos el significado de los elementos, el reto pendiente es determinar cada valor en nuestro caso usado como ejemplo. Tal vez esta es la parte más engorrosa (i.e. qué es a lo que nos referimos con “si la otra hipótesis es cierta, qué tan esperada es la evidencia?”).

Existen distintas maneras en las que se ha explicado la lógica detrás del Teorema de Bayes, por ejemplo gráficamente utilizando el Diagrama de Venn o con herramientas para tomar decisiones como el Árbol de Decisión; sin embargo creo que esto se puede lograr mediante una manera más sencilla. Propongo utilizar lo que llamaremos la Tabla de Fuerza de las Hipótesis, la cual es una representación visual de las hipótesis en competencia y su relación con la nueva evidencia.

La mejor manera de explicarla es aplicándola directamente a la pregunta sobre el “amorío” mencionada párrafos arriba. A continuación la tabla es presentada, seguida por una descripción paso a paso de su contenido.

1*FJ13-8JsUdqt41t1oDS8fw.png

Nuestra meta es determinar la probabilidad que una persona llamada X, quien te coquetea en una fiesta, realmente quiera tener una amorío contigo. Por lo tanto, tenemos que considerar las dos hipótesis en competencia: la persona X “quiere” vs “no quiere” tener un amorío contigo.

Empezamos asignando una probabilidad a la hipótesis H basándonos en nuestro conocimiento previo. Una hipótesis es una suposición tentativa hecha para mostrar y probar sus consecuencias lógicas y empíricas [2]. Para asignar una probabilidad a la hipótesis pregúntate: con todo la información que tengo, y basándome en mi experiencia, ¿qué tan probable es que alguien a la que conozca en una fiesta quiera tener un amorío conmigo?

Si no conoces la respuesta dale un probabilidad de 50% (un resultado entre dos posibilidades). Es evidente ahora que si p(H) es 50%, p(~H) también es 50%. Recuerda, siempre procura asignar un valor a H basándote en la información más objetiva que tengas. Si cuentas con información externa, actualiza tu estimación intuitiva con el enfoque de la vista desde afuera.

El hecho que X te haya coqueteado es una pieza de evidencia crucial para saber si él o ella quiere tener un amorío contigo. Aquí es donde se pone interesante.

Para encontrar el valor de p(E|H) pregúntate: si la hipótesis es cierta, ¿qué tan esperada es la evidencia? En nuestro ejemplo, considerando a todas las personas de la fiesta que quieren tener un amorío conmigo, ¿qué tan esperado es que me coqueteen? Nota que ahora estamos en un universo que sólo incluyen a las personas que quieren tener un amorío contigo. Le damos una probabilidad del 60% porque hay muchas personas que no son coquetas incluso cuando gustan de alguien. Este valor es representado por la barra con el signo “+”. La barra con el signo “-” representa a todas las personas que quieren tener un amorío contigo pero no tienden a coquetear, estimadas en un 40%.

Finalmente incluimos el efecto de la hipótesis alternativa en nuestro cálculo estimando el valor de p(E|~H). Considerando a todas las personas que no quieren tener un amorío conmigo, ¿qué tan esperado es que me coqueteen? Asignamos una probabilidad de 10% porque hay personas que coquetean incluso cuando no quieren tener un amorío.

A continuación se muestra el desarrollo de su resolución matemática:

1*9t9SaJ53JeC6twpO7Ds_5w.png

Gracias al Teorema de Bayes podemos establecer que la probabilidad que alguien que te coquetea quiera tener un amorío es 85%. Notablemente, es esperable que este resultado tenga un efecto en nuestro comportamiento. Asumiendo que la atracción con la persona X es mutua, ¿cuál sería tu comportamiento hacia él o ella sabiendo que tienes 8.5 de 10 chances que quiera tener un amorío contigo?

Como un comentario adicional, si estás interesado en explorar el teorema con mayor profundidad, prueba esta calculadora bayesiana para estimar tus propias probabilidades a posteriori basándote en tus creencias y experiencias personales http://camspiers.github.io/Bayes/. Te puedo asegurar que, para este y cualquier otro caso que puedas imaginar, se convierte en un juego adictivo.

Llevando a Bayes un poco más allá

Antes de terminar utilizaremos el Teorema de Bayes para mejorar nuestra estimación de probabilidades en otra clase de problema.

Regresemos al dilema propuesto en el artículo “Moldeando la Incertidumbre”, donde los lectores fueron colocados en una situación hipotética en la que tenían que decidir entre quedarse en su trabajo o renunciar para unirse a un nuevo proyecto empresarial. En este ejemplo la probabilidad de éxito de la empresa fue estimada en un 65% (aquí, nuestra probabilidad a priori).

Hoy, Esperanza—tu adorable amiga quien te quiere persuadir a que te le unas en su nuevo negocio — te cuenta que acaba de concretar un trato con una compañía de inversión que va a dar a la empresa una cantidad significativa de dinero, la cual permitirá un pronto inicio de operaciones.

Decides investigar en el internet y encuentras un estudio que señala que de las empresas que son exitosas a largo plazo, 25% han recibido un importante aporte financiero en una etapa temprana. Adicionalmente, 15% de las empresas que fracasan han recibido esta clase de financiación ¿Cómo esta nueva evidencia puede afectar tu cálculo de probabilidades?

La Figura 3 muestra la representación Bayesiana de este caso con la Tabla de Fuerza de las Hipótesis.

23.png
24.png

Usando un enfoque Bayesiano actualizamos nuestra hipótesis con nueva evidencia y resulta en que la probabilidad de éxito de este nuevo negocio es de 76% dado que pronto recibirá una fuerte inversión inicial.

Si incluimos este dato en el modelo USE la opción de renunciar a tu trabajo tiene una utilidad de 46.4, mientras que el quedarte resulta en una utilidad de -15.6 [ii] . Por lo tanto, con la más reciente evidencia tu grado de creencia en la hipótesis de “éxito” crece y la confianza en la decisión de renunciar a tu trabajo se fortalece.

Finalmente, ten en cuenta que con la llegada de evidencia contradictoria las estimaciones de probabilidad y utilidad seguramente cambiarán. Este es el pensamiento Bayesiano después de todo.

El tener una verdadera mentalidad Bayesiana implica considerar nuestros juicios de valor y decisiones a medida que nuevo conocimiento aparezca, y también volver a evaluar — e incluso cambiar — nuestros supuestos cada vez que adquiramos nueva información. Esto requiere de nosotros una actitud de curiosidad y apertura de mente sobre la data más reciente, y escepticismo sobre nuestras creencias previas. Personalmente el Teorema de Bayes es definitivamente uno de los conceptos que me hubiera gustado haber aprendido desde mucho más joven, tal vez desde que me enseñaron álgebra en la escuela. Afortunadamente nunca es tarde, te lo puedo asegurar.

El artículo en un párrafo

Este capítulo explicó el Teorema de Bayes, una manera con la cual podemos mejorar la dudosa calidad de nuestra estimación de probabilidades en situaciones de incertidumbre, un reto elusivo que está limitado por la falta de un fácil entendimiento sobre qué hacer con la llegada de nueva evidencia. El Teorema de Bayes es una herramienta fundamental para actualizar nuestro grado de creencia en una hipótesis basándonos en la ocurrencia de otro evento, potencialmente mejorando la calidad de las decisiones que tomamos. La Tabla de Fuerza de las Hipótesis es sugerida como una forma para visualizar su lógica.

Artículo recomendado: Moldeando la Incertidumbre. Cómo tomar mejores decisiones en situaciones de incertidumbre (Parte 1)

 

Notas

[i] La explicación completa sobre cómo usar la estimación de probabilidades para tomar decisiones usando el método de la Utilidad Subjetiva Esperada (USE) es desarrollada en la “Moldeando la incertidumbre” . Aunque el presente artículo contiene los conceptos necesarios para entender el Teorema de Bayes, recomiendo leer la primera parte de la serie de tal manera que el lugar y el rol del pensamiento Bayesiano como potenciar de la toma de decisiones es más claro.

[ii] La derivación de la fórmula se encuentra más allá de los objetivos de este artículo. Una extensa explicación se puede encontrar en https://plato.stanford.edu/entries/bayes-theorem/ .

Referencias

[1]Meta analysis of the use of Bayesian networks in breast cancer diagnosis. Por Priscyla Waleska Simões et.al

[2] Forecasting the 2012 and 2014 Elections Using Bayesian Prediction and Optimization. Por Steven E. Rigdon , Jason J. Sauppe y Sheldon H. Jacobson

[3] Bayesian Reasoning and Machine Learning Por David Barber

[4] The Probability of God: A Simple Calculation That Proves the Ultimate Truth. Por Stephen D. Unwin

[5] Disproving Gods with History and Science. Conferencia de Richard Carrier

Bayesian calculator http://camspiers.github.io/Bayes/

Bayes’ Theorem. Lust for Glory. Conferencia de Richard Carrier en Skepticon 4

Pedro Del CarpioComment