miércoles, 23 de noviembre de 2011

Partes de La Teoría de la Probabilidad


¿QUE ESTABLECE LA TEORÍA DE LA PROBABILIDAD?



La teoría de la probabilidad propone un parámetro  para  la determinación de las diversas causalidades obtenidas tras una serie de eventos esperados dentro de un rango estadístico.

La teoría de la probabilidad se desarrollo para intentar predecir eventos aleatorios, y esta estrechamente vinculada con las distancias técnicas de conteo .

El desarrollo de dicha teoría aumenta su alcance en aplicaciones de conocimiento que el hombre hace útiles para su evolución en diferentes campos de aprendizaje .

Algunos de los campos de aprendizaje son: Matemáticas, estadística, ciencias, filosofía, Física, Finanzas, Arquitectura. También en el análisis de riesgo y el comercio de los mercados de materias primas, implementados por los gobiernos .

En estadística muchos conjuntos de datos se pueden aproximar, con gran exactitud, utilizandodeterminadas distribuciones probabilísticas; los resultados de éstas se pueden utilizar para analizar datos estadísticos.

La teoría de la probabilidad se inicio prácticamente con el análisis de los juegos de azar. Sus tres pioneros fueron: Blaise Pascal (1623-1662), Pierre de Fermat (1601-1665), Pierre Simón de Laplace (1749-1827).

Espacio muestral: Es un conjunto que contiene todos los resultados posibles, que se dieron a a partir de una experiencia aleatoria (pudiéndose representar con (letra en mayúscula) S, E, o la letra griega Ω).En el que cada uno de los experimentos aleatorios se les designa como resultado básico (o elemental), comportamiento individual o punto muestral.

Ej: Para lanzar un dado se sabe que el conjunto de elementos que se esperan obtener son: 1, 2, 3, 4, 5, ó 6, por lo cual su espacio muestral se verá conformado por estos seis posibles resultados, quedando así  Ω:{1, 2, 3, 4, 5, 6}.

El espacio muestral puede mostrarse a través de resultados o por una regla, de acuerdo a las situación planteada, para este caso se pedirá el espacio muestral de poner a girar 2 ruedas,cada una con 10 números del 0 al 9.

Regla -> (E:{xy/x,y ∈  Z[0,9]})
E:{00,01,02,03…,97,98,99}

La probabilidad de un evento seguro es 1
La probabilidad de un evento imposible es 0

Nota: equiprobabilidad es decir si todos los puntos muéstrales tienen igual probabilidad.
Hay 2 tipos de eventos:
1.    Eventos Simples: en este solo hay un punto muestral. denotados por letras minúsculas o e¡.
P(e¡)=1/n Solo si todos los puntos muéstrales son equiprobables.
 n( número de elementos del espacio muestral).

2.    Eventos Compuestos: compuestos por más de un punto muestral. Denotados con letra mayúscula (A, B...)
P(B)=m/n Solo si todos los puntos muéstrales son equiprobables.

En el caso contrario de que no presenten equiprobabilidad se hace uso de esta fórmula:  

Diagrama de Árbol: Usada para establecer todos los posibles resultados de un experimento aleatorio. Para lo cual  se necesita conocer el número de elementos que forman parte del espacio muestral, los cuales  se pueden determinar con la construcción del diagrama de árbol.


Ejemplo: Una universidad está formada por tres facultades: 

-La 1ª con el 50% de estudiantes.
-La 2ª con el 25% de estudiantes.
-La 3ª con el 25% de estudiantes.
Las mujeres están repartidas uniformemente, siendo un 60% del total en cada facultad.


¿Probabilidad de encontrar una alumna de la primera facultad?



P(alumna de la 1ra facultad) =0,5*0,6=0,3
¿Probabilidad de encontrar un alumno varón?

P(alumno varón)= 0,5*0,4+0,25*0,4+0,25*0,4=0,4
Pero también podría ser lo contrario.


Teoría básica sobre composición de eventos

La composición de eventos se dará por la intersección o la unión entre dos o más eventos.
 Dados dos eventos A y B, entonces:
-El evento A∩B (intersección) ocurre si A y B ocurren a la vez.
Ej: SI A = {1, 2, 3, 4, 5}
    B = {1, 2, 4, 6}
A ∩ B = {1, 2, 4} y B ∩ A = { 1, 2, 4}
Cumpliéndose que A ∩ B = B ∩ A
P (A∩B)=P (AB)
P (A∩B)= m/n si los puntos muestrales son equiprobables.
Si no (si los puntos muestrales no son equiprobables):

P(A∩B) = 


-El evento AUB  (unión) ocurre si por lo menos ocurre AB o ambos.
Ej. SI A = {1, 2, 3, 4, 5}
    B = {1, 2, 4, 6}
A U B = {1, 2, 3, 4, 5, 6} y  B U A = {1, 2, 3, 4, 5, 6}
Cumpliéndose que A U B = B U A
P (AUB)=m/n si los puntos muéstrales son equiprobables.
m= No. De puntos muéstrales que conforman el evento AUB.
n= Tamaño del espacio muestral.
Si este no es el caso (de que no sean equiprobables los puntos muestrales)

P(AUB) = 





Eventos mutuamente excluyentes (eventos disyuntos): Si no pueden ocurrir simultáneamente ( que no tienen resultados en común).
P(AB)=0
Ej: Cuando se lanza una moneda solo puede llegar a ocurrir que salga cara o sello, pero no pueden suceder las dos al mismo tiempo, lo que significa que son eventos excluyentes.
Dos o más eventos son no excluyentes ( o conjuntos), cuando es posible que se den ambos. Esto no indica que necesariamente deban ocurrir estos eventos en forma simultánea.
Ej: Si se considera sacar al menos un blanco y un seis de un juego de domino, estos eventos son no excluyentes porque se puede dar que salga el seis blanco.
Eventos complementarios: Solo si son disyuntos y su unión forma el espacio muestral. Es decir, se dan A y B dos eventos de un experimento, entonces:
AUB = Ω  entonces A y B son eventos complementarios.
Ej: Se lanza un dado.
Ω= {1, 2, 3, 4, 5, 6}
Sale par:
E1 = {2, 4 ,6}
Sale impar.
E2 = {1, 3, 5}
Sale menor que 3.
E3 = {1,2}
Sale 3 o más.
E4 = {3, 4, 5, 6}
El y E2 son eventos complementarios y E3 y E4 son también eventos complementarios.
Sale 5 El = {5} No sale 5  E2 = ( 1, 2, 3, 4, 6} Por tanto El y E2 serán también eventos complementarios.
Eventos Colectivamente exhaustivos: solo si la unión de ellos conforman el espacio muestral.


La ley multiplicativa de probabilidades indica que la probabilidad de que dos sucesos A y B ocurran simultáneamente es igual a: P(A y B)= P(A/B)*P(B) .La ley multiplicativa anterior se utiliza también con el fin de determinar una probabilidad condicional P(A/B) con base en los valores 
P(A y B) y P(B):     





 Por ej: se quiere estudiar la incidencia del hecho de ser fumador como factor de riesgo en el desarrollo de una enfermedad en una determinada población. Para ello se diseñó un estudio prospectivo y, tras seleccionar una muestra de 180 sujetos( resultados mostrados en tabla 1).


Considerando toda la muestra, la probabilidad de desarrollar la enfermedad (E) en la población de estudio es:  P(E)=80/180=0.444=> 44,4%

Mientras que la probabilidad de padecer la enfermedad un fumador (F) es: P(E/F)=60/70=0,857=>>85,7%

Y un no fumador: P(E/F)=20/110=0,182=>18,2%

Teniendo en cuenta que:
P(F)=70/180=0,389=>38,9%      P(F)=1-P(F)=1-0,389= 0,611 =>61,1%
P(F y E)= 60/180=0,333=>33,3%     P(F y E)=20/180=0,111 =>11,1%

Podría haberse aplicado la fórmula (4) para obtener cualquiera de las dos probabilidades condicionadas anteriores, resultando idénticos valores:



En el ejemplo, se constata por lo tanto que la incidencia de la enfermedad es diferente en la población fumadora que en la no fumadora (85,7% vs 18,2%). Así pues, la probabilidad de desarrollar la enfermedad depende de si se es o no fumador. En otras ocasiones, sin embargo, sucede que la ocurrencia o no de un determinado fenómeno B no influye en la ocurrencia de otro suceso A. Se dice entonces que los sucesos A y B son independientes y se verificará que:


P(A/B)=P(A)                            (5)


Sustituyendo (5) en (3) se obtiene entonces que:
P(AyB)= P(A)*P(B)


Es decir, en caso de independencia, la probabilidad de que ocurran dos sucesos de forma simultánea es igual al producto de las probabilidades individuales de ambos sucesos.Así, dos sucesos son independientes, si el resultado de uno no tiene efecto en el otro; o si el que ocurra el primero de ellos  no hace variar la probabilidad de que se de el segundo.
Obviamente, en la práctica, y debido a las variaciones en el muestreo, será extremadamente difícil encontrar una muestra que reproduzca de forma exacta las condiciones de independencia anteriores. El determinar si las diferencias observadas son o no compatibles con la hipótesis de independencia constituye uno de los principales problemas que aborda la estadística inferencial.




  • Si se considera un fenómeno con k resultados posibles, mutuamente excluyentes, B1, B2,...,Bk y se conoce la probabilidad de cada uno de ellos, el llamadoTeorema de las Probabilidades Totales permite calcular la probabilidad de un suceso A a partir de las probabilidades condicionadas:




Utilizando la expresión para el cálculo de la probabilidad de la intersección de dos sucesos se tiene que 

 y, por lo tanto :


En el ejemplo anterior, podría aplicarse este resultado para el cálculo de la incidencia de la enfermedad en la población de estudio:

Las leyes aditiva y multiplicativa, junto con la noción de probabilidades condicionadas y el teorema de las probabilidades totales se han empleado para desarrollar el llamado Teorema de Bayes, de indudable interés en la aplicación de la estadística al campo de la medicina. Si se parte de la definición de probabilidad condicionada (4):


Siempre que P(A)≠0 y P(B)≠0. Aplicando además el teorema de las probabilidades totales se llega a que:



El diagnóstico médico constituye un problema típico de aplicación del Teorema de Bayes en el campo médico, puesto que permite el cálculo de la probabilidad de que un paciente padezca una determinada enfermedad una vez dados unos síntomas concretos. La capacidad predictiva de un test o de una prueba diagnóstica suele venir dada en términos de su sensibilidad y especificidad12. Tanto la sensibilidad como la especificidad son propiedades intrínsecas a la prueba diagnóstica, y definen su validez independientemente de cuál sea la prevalencia de la enfermedad en la población a la cual se aplica. Sin embargo, carecen de utilidad en la práctica clínica, ya que sólo proporcionan información acerca de la probabilidad de obtener un resultado concreto (positivo o negativo) en función de si un paciente está realmente enfermo o no. Por el contrario, el concepto de valores predictivos, a pesar de ser de enorme utilidad a la hora de tomar decisiones clínicas y transmitir información sobre el diagnóstico, presenta la limitación de que dependen en gran medida de lo frecuente que sea la enfermedad a diagnosticar en la población objeto de estudio. El Teorema de Bayes permite obtener el valor predictivo asociado a un test al aplicarlo en poblaciones con índices de prevalencia muy diferentes.
Consideremos como ejemplo un caso clínico en el que una gestante se somete a la prueba de sobrecarga oral con 50 gramos de glucosa para explorar la presencia de diabetes gestacional, obteniéndose un resultado positivo. Es sabido que dicho test presenta unos valores aproximados de sensibilidad y especificidad en torno al 80% y al 87%, respectivamente. Si se conoce además que la prevalencia de diabetes gestacional en la población de procedencia es aproximadamente de un 3%, por medio del teorema de Bayes podemos conocer la probabilidad de que el diagnóstico sea correcto o, equivalentemente, el valor predictivo positivo:





Se puede concluir por lo tanto que, a pesar de obtener un resultado positivo en la prueba, existe sólo una probabilidad de un 15,9% de que la paciente padezca diabetes gestacional.
Supongamos que además dicha paciente tiene más de 40 años de edad. Se sabe que en grupos de edad más avanzada la prevalencia de diabetes gestacional entre las gestantes llega a aumentar hasta aproximadamente un 8%. En este caso, el valor predicativo positivo asociado vendrá dado por:




En este caso las posibilidades de un diagnóstico de diabetes gestacional aumentan hasta un 34,86%.