TEOREMA DE BAYES





TEOREMA DE BAYES




 Un resultado sencillo y un fundamento para hacer Estadística

En 1763 se publicó el artículo An essay towards solving a problem in the doctrine of chances, (Un ensayo hacia la solución de problemas en la disciplina del azar. T. del Ed.) escrito por el reverendo Thomas Bayes (1701-1761). En dicho artículo, Bayes presentó una sencilla demostración de la teoría de la probabilidad cuyas consecuencias difícilmente podía prever. Con esa demostración, Bayes estableció los principios de la estadística bayesiana, la cual después cayó en el olvido y fue marginada por muchos años, hasta su resurgimiento y utilización para resolver todo tipo de problemas, desde la interpretación de mensajes en la Segunda Guerra Mundial hasta la actual decodificación del material genético.

Bayes ya había muerto cuando su famoso artículo fue enviado por su amigo Richard Price a la revista Philosophical Transactions. Algunos estudiosos todavía debaten si Price únicamente envió el artículo o también tuvo alguna intervención como autor.

El de Bayes es un teorema válido del "cálculo de probabilidades", lo que hoy llamamos "Teoría Matemática de la Probabilidad" (TMP). Este teorema también es conocido como teorema de la Probabilidad Inversa, pues explica cómo obtener la probabilidad de un evento A dada la información B calculándola al revés, esto es, estableciendo la probabilidad a priori del evento A, y la probabilidad de que hubiese ocurrido el evento B dado el evento A.

Con las herramientas y la elaboración de la TMP actuales el teorema de Bayes es muy sencillo de probar. De hecho Bayes probó una versión particular que se ha generalizado a espacios abstractos usando medidas de probabilidad. En términos de la TMP, la historia del teorema de Bayes básicamente termina ahí, en un teorema sencillo. Pero como es de uso común en la TMP hasta nuestros días, Bayes también quiso "interpretar" el teorema, es decir, explicarlo en términos de una posible interpretación de la teoría.

Pongamos un ejemplo: ¿Cuál es la probabilidad P de que mañana martes llueva en la ciudad de Guanajuato? La "lluvia de mañana martes en la ciudad de Guanajuato" es el evento A. Lo que sabemos del evento, la información que obtengamos, como los datos meteorológicos actuales y pasados (del pasado inmediato y mediato), la humedad, el clima regional, etcétera, se representan con B. La propuesta de Bayes es calcular cuál es la probabilidad de que llueva mañana martes dada la información de B. Eso es hacer estadística: tenemos unos datos, y dado que tenemos esos datos queremos calcular la probabilidad de algún evento. Con esto Bayes fundó una manera de hacer estadística que ahora llamamos estadística bayesiana.

Supongamos que los meteorólogos le asignan al evento A una probabilidad de 5%. Pero, ¿qué quiere decir eso? En otras áreas de estadística, en la estadística frecuentista, eso se interpreta en términos de muestras repetidas. Se dice: "Si tomas muchas muestras del evento A, el porcentaje tal de los casos caerá en tal o cual intervalo". Pero este problema, el de la lluvia, no podemos tomar la muestra porque sólo hay un "mañana martes" único e irrepetible. Sólo de ciertos aspectos podemos tomar datos y pensar que podemos repetir una muestra. El argumento frecuentista se aplica en esos casos, pero en éste, ¿qué quiere decir que la probabilidad de que llueva mañana es del 5%?

La teoría Bayesiana establece, ese número (la probabilidad) no representa una frecuencia, sino que es una medida de lo que conocemos nosotros, una medida de nuestra incertidumbre y de nuestra certeza. Si al evento "llueve mañana martes en la ciudad de Guanajuato" le asignamos una probabilidad de 5% dados los datos que tenemos, lo que significa es que "nosotros" tenemos más o menos la certeza de que no va a llover mañana, porque es muy poco probable. Entonces lo que mide la estadística bayesiana es la certidumbre y la incertidumbre, la seguridad de quien está esperando el evento, y no solamente "propiedades" del evento en sí. Esto significa también que la probabilidad es una opinión que se puede volver una apuesta. Es una opinión de un "agente" que puede ser una persona o, en nuestro ejemplo, el Sistema Meteorológico Nacional. Esto es, la probabilidad se refiere a un agente acerca de un evento, lo que el agente sabe acerca del evento.

La teoría bayesiana fue desarrollada en el siglo XX al axiomatizar sus principios con los trabajos de De Finetti, Ramsey y Savage, y posteriormente con su fundamentación filosófica, dentro de la epistemología moderna. La idea fundamental, sugerida originalmente por Keynes, es interpretar a la probabilidad como un "grado de conocimiento", no como una frecuencia. Esto fue formalizado al identificar los grados de incertidumbre como un sistema de apuestas, justo para un "agente" que establece la probabilidad a priori de A, las condiciones B dado que ocurre el evento A, y finalmente calcula la probabilidad P de que ocurra el evento A dada la información B.

La publicación del artículo de Bayes, a sus 250 años, nos da un ejemplo contundente de como una idea simple, pero auténtica y fundamentalmente diferente, puede ser seminal y cimentar el desarrollo de toda una disciplina y escuela de pensamiento, como lo es la estadística bayesiana moderna. Sin duda es uno de los artículos fundamentales de la estadística y un evento a celebrar en el Año Internacional de la Estadística.
El teorema de Bayes es un procedimiento para obtener probabilidades condicionales (probabilidades de ocurrencia de acontecimientos condicionadas a la ocurrencia de otros acontecimientos). La expresión del teorema de Bayes para dos variables discretas es:
P(A/B)=P(B/A)P(A)/P(B)
Para variables que toman más de dos valores, la expresión es:

p(ƟIX)=  p(XIƟ)p(Ɵ)
              E p(XIƟ)p(Ɵ)  
El teorema de Bayes da respuesta a cuestiones de tipo causal, predictivas y de diagnóstico. En las cuestiones causales queremos saber cuál es la probabilidad de acontecimientos que son la consecuencia de otros acontecimientos. En las cuestiones predictivas queremos saber cuál es la probabilidad de acontecimientos dada información de la ocurrencia de los acontecimientos predictores. En las cuestiones de tipo diagnóstico queremos saber cuál es la probabilidad del acontecimiento (o acontecimientos) causales o predictivos dado que tenemos información de las consecuencias. Para resumir, en las situaciones causales o predictivas desconocemos las consecuencias y tenemos evidencia de las causas. Por el contrario, en las situaciones de diagnóstico desconocemos las causas y tenemos evidencia de las consecuencias.
 Ejemplo
Unos psicólogos especializados en el tratamiento de trastornos de personalidad están interesados en diagnosticar el trastorno que afecta un paciente, en el que observan un conjunto de síntomas que indican que el paciente podría sufrir el trastorno A o el trastorno B. Además saben que los porcentajes de individuos afectados por los trastornos A, B o ningún trastorno son 10, 30 y 70. También saben que el porcentaje de individuos afectados por el trastorno A y que muestran el síntoma X es igual al 60%, el porcentaje de individuos que sufren el trastorno B y muestran el síntoma X es el 30% y el porcentaje de individuos no afectados que muestran los síntomas de trastorno es el 10%. Resumiendo, la información que disponemos es:

Trastorno               p(Ɵ)          Síntoma         P(XIƟ)
      A                          .1                 Si                    .6
      B                          .3                 Si                    .3
      C                          .7                 Si                    .1
(Ɵ simboliza trastorno en general)

Sustituyendo en el teorema de Bayes:

p(trastornIsimptoma)= p(trastornIsimptoma)p(trastorn)=
                                                E p(simptomaI trastorn)

P(ƟAIx)=   (.6)(.1)/ (.6)(.1)+(.3)(.3)+(.1)(.7)=.27     
la probabilidad de que el individuo padezca el trastorno A es 0.27. Las probabilidades de que esté afectado por el trastorno B o el C son:
p(No transtornoIX)=(1).(7)/(6)(.1)+(3)(1)(.7)=32
La conclusión es que lo más probable es que el individuo padezca el trastorno B, pero es un valor moderado y los psicólogos piensan que hay que obtener más evidencia.
El teorema de Bayes es especialmente adecuado para actualizar las conclusiones a medida que disponemos de nueva información. Pasado un tiempo observan que el paciente muestra un nuevo síntoma (Y), y saben que presentan Y el 70% de los individuos que sufren el trastorno A, el 20% de los individuos que sufren B y el 10% de los individuos que padecen el trastorno C. Para obtener las probabilidades incorporando la nueva información hacemos que las probabilidades posteriores pasen a ser las probabilidades previas:

P(ƟAIy)=         (.7)(.27)/ (.7)(.27)+(.2)(.41)+(.1)(.32)=.62
P(ƟBIy)=         (.2)(.41)/ (.7)(.27)+(.2)(.41)+(.1)(.32)=.27
P(ƟNo trastorno iIy)=         (.1)(.32)/ (.7)(.27)+(.2)(.41)+(.1)(.32)=.11

Una vez hechos los cálculos la probabilidad de que el individuo esté afectado por el trastorno A ha pasado de 0.27 a 0.62

EJEMPLOS

EJEMPLO 1

En la sala de pediatría de un hospital, el 60% de los pacientes son niñas. De los niños el 35% son menores de 24 meses. El 20% de las niñas tienen menos de 24 meses. Un pediatra que ingresa a la sala selecciona un infante al azar.
a. Determine el valor de la probabilidad de que sea menor de 24 meses.
b. Si el infante resulta ser menor de 24 meses. Determine la probabilidad que sea una niña.
SOLUCIÓN:
Se definen los sucesos:
Suceso H: seleccionar una niña.
Suceso V: seleccionar un niño.
Suceso M: infante menor de 24 meses.
En los ejercicios de probabilidad total y teorema de bayes, es importante identificar los sucesos que forman la población y cuál es la característica que tienen en común dichos sucesos. Estos serán los sucesos condicionados.
a. En este caso, la población es de los infantes. Y la característica en común es que sean menores de 24 meses. Por lo tanto, la probabilidad de seleccionar un infante menor de 24 meses es un ejemplo de probabilidad total. Su probabilidad será:

P(M)= P(H)*(M/H)+P(V) * P(M/V) = 0,6*0,2+0,4*0,35= 0,26 ó 26%
b. Para identificar cuando en un ejercicio se hace referencia al teorema de bayes, hay que partir de reconocer esta es una probabilidad condicionada y que la característica común de los sucesos condicionantes ya ha ocurrido. Entonces, la probabilidad de que sea niña una infante menor de 24 meses será:

P(HIM)=P(H)*P(MIH)/P(H)*P(MIH)+P(V)*P(V)*P(MIV)
=0,6*0,2/0,6*0,2+0.4*0,35=0,12/0,26=0,46 ó 4%
EJEMPLO 2
Un médico cirujano se especializa en cirugías estéticas. Entre sus pacientes, el 20% se realizan correcciones faciales, un 35% implantes mamarios y el restante en otras cirugías correctivas. Se sabe además, que son de genero masculino el 25% de los que se realizan correcciones faciales, 15% implantes mamarios y 40% otras cirugías correctivas. Si se selecciona un paciente al azar, determine:
a. Determine la probabilidad de que sea de género masculino
b. Si resulta que es de género masculino, determine la probabilidad que se haya realizado una cirugía de implantes mamarios.
SOLUCIÓN:
Se definen los sucesos:
Suceso F: pacientes que se realizan cirugías faciales
Suceso M: pacientes que se realizan implantes mamarios
Suceso O: pacientes que se realizan otras cirugías correctivas
Suceso H: pacientes de género masculino
a. La probabilidad de que sea de género masculino se refiere a un problema de probabilidad total, ya que es el suceso condicionado y las cirugías los condicionantes. Dicho valor será:
P(H)=p(F)*P(HIF)+P(M)*P(HIM)+P(O)*P(OIH)
P(H)=0,2*0,25+0,35*0,15+0.45*0,40=0,28 Ó28%

b. Como el suceso condicionado ha ocurrido entonces se aplica el teorema de bayes, luego, el valor de la probabilidad será:

P(MIH)=P(M)*P(HIM)/P(F)*P(HIF)+P(M)*P(HIM)+ P(O)*P(OIH)

P(MIH)=0,35*0,15/0,2*0,25+0.35*0,15+0,45*0,40= 0,0525/0,2825 =0.19 Ó 19%

EJEMPLO 3
Un Doctor dispone de tres equipos electrónicos para realizar ecosonogramas. El uso que le da a cada equipo es de 25% al primero, 35% el segundo en y 40% el tercero. Se sabe que los aparatos tienen probabilidades de error de 1%, 2% y 3% respectivamente. Un paciente busca el resultado de una ecografía y observa que tiene un error. Determine la probabilidad de que se ha usado el primer aparato.
SOLUCIÓN:
Se definen los sucesos:
Suceso P: seleccionar el primer aparato
Suceso S: seleccionar el segundo aparato
Suceso T: seleccionar el tercer aparato
Suceso E: seleccionar un resultado con error
Se puede observar que la pregunta es sobre determinar la probabilidad de que un examen errado sea del primer aparato, es decir, ya ha ocurrido el error. Por lo tanto, debemos recurrir al teorema de bayes. Claro está, que es necesario de igual forma obtener la probabilidad de que los aparatos produzcan un resultado erróneo, por lo tanto
P(PIE)=P(P)*P(EIP)/P(P)*P(EIP)+P(S)+*P(EIS)+P(T)*P(EIT)
P(PIE)=(O,25*0,01/0,25*0,01+35*0,02+0.4*0.03)=0,0025/0,0215=0,116=0,12 Ó 12%



No hay comentarios.:

Publicar un comentario