1
Grupos 24 y 28 04/03/2015
TEMA 7: MODELOS TERICOS DE PROBABILIDAD
Los modelos tericos de probabilidad son una serie de funciones de densidad y de distribucin,
y son para una serie de variables que van a aparecer muchsimas veces en medicina.
DISTRIBUCIN DE BERNOULLI
Tenemos a nuestro paciente, entra a nuestra consulta y este paciente puede estar enfermo o
puede estar sano. Este es el experimento ms sencillo que podemos tener.
Elegir una persona de la poblacin y que est enfermo. P es la prevalencia de la enfermedad
en la poblacin de la que procede ese enfermo. Y tenemos tambin que aplicar un tratamiento
a un enfermo, podra ser obtener un xito (curarle) o un fracaso. Vas a intervenir
quirrgicamente a un paciente, puedes tener un xito o un fracaso.
Sucesos del espacio muestral omega: E es estar enfermo o tener un xito en la curacin del
paciente. E complementario, que sera el F, es estar sano o no curar al paciente.
Creamos ahora una variable aleatoria, X discreta que tome slo dos resultados. Si el resultado
es un xito esta variable va a tomar valor 1, y si es un fracaso va a tomar valor 0. Esta es una
2
variable indicador, indica que ha ocurrido algo. Ha ocurrido un xito, ha ocurrido que este
paciente tena la enfermedad, o ha ocurrido que este paciente se ha curado. Da igual, pero
puedo utilizar esta variable para sealar multitud de sucesos.
Esta variable de Bernoulli, esta variable X, tiene una funcin de cuanta. Cul es esta funcin
de cuanta? Este paciente va a tener la enfermedad con una prevalencia P, esta P es la
probabilidad de obtener un xito, una curacin o estar enfermo. Si esto es estar enfermo, esta
P es la prevalencia de la enfermedad, pero si esto es tener un xito en la operacin, lo que
tengo que hacer previamente es estudiar qu es lo que ha pasado con varios individuos a los
cuales les hayamos hecho la misma operacin y ver cul es esta frecuencia relativa de xito
que sera P.
Cul sera la probabilidad de no tener un xito? Estamos aplicando una norma de
probabilidad. Si tenemos un suceso, cul es la probabilidad de que no ocurra ese suceso, pues
1 menos la probabilidad de que ocurra. Tenemos P, y a este 1 P se le denomina Q y sera la
probabilidad de no curar o de no tener la enfermedad. Es un experimento, es coger a un
individuo y ste puede o no tener la enfermedad. Se le interviene, y se analiza cul es la
probabilidad de obtener un xito o un fracaso en esa intervencin. Es el experimento que se
hace constantemente en clnica.
*p = probabilidad de xito y q =probabilidad de un fracaso.
Esto es la variable de Bernoulli. Esto es para un individuo. Qu va a pasar entonces cuando
nosotros tenemos varios individuos? Bueno, fijaos, decimos entonces que X sigue una
distribucin de Bernoulli, cuando tenemos una situacin de un solo individuo y tenemos un
xito o un fracaso, solamente decimos que X sigue una distribucin de Bernoulli. En este tipo
de experimentos con resultados dicotmicos, la distribucin de la variable queda
completamente determinada conociendo el parmetro P.
3
La media o esperanza de X (siendo X la variable de Bernoulli), sera p, y la varianza sera p x q
(esto s que lo tenis que saber). Hay que saber de cada una de las distribuciones cul es la
funcin de densidad, de distribucin, y por supuesto cul es la media y la varianza. Si la
varianza es p x q, la desviacin estndar sera la raz cuadrada de p x q. As que ya tenemos la
distribucin de Bernoulli, la cual es para una variable que solo puede tomar dos valores: 0 1.
DISTRIBUCIN BINOMIAL
En lugar de hacer un experimento con un paciente, ahora vamos a hacer n experimentos.
Fijaos, voy a coger a mi paciente nmero 1, nmero 2, nmero 3 y nmero n. Para cada
paciente vamos a crear una variable de Bernoulli, X1, X2, X3, Xn. Aqu todas son maysculas
porque son los indicativos o nombres de las variables. Esta variable, va a tomar valor 1 0, y
esta otra variable X2 va a tomar valor 1 0 dependiendo de las caractersticas de este
paciente. En lugar de tener una distribucin de Bernoulli solamente, vamos a tener n
distribuciones de Bernoulli, una para cada uno de los pacientes.
Voy a crear una variable X que va a ser la suma de X1 + X2 + Xn.
Si digo, quiero contar los individuos que tienen aqu esta caracterstica, que son naranjas.
Imaginemos que los naranjas son los aos. Cundo va a tomar valor 1 la variable X1? Cuando
este individuo sea naranja. En este caso X1 va a ser igual a 1. Qu valor va a tomar X2? Va a
tomar el valor 0 porque no es naranja. Si yo quiero contar los naranjas, X3 va a tomar valor 1.
Si yo voy a sumar X1, X2 y X3 (variables que solamente toman valor 0 1).
Si quiero contar los individuos de color rojo, el que sea naranja ser 0, X2 sera 1 y X3 sera 0. A
si que, cuando sumo todas las variables lo que obtengo es el nmero de individuos que tienen
una determinada caracterstica o el nmero de xitos que tengo en n pruebas.
4
Esto se aplica en medicina? S, se aplica continuamente, por ejemplo el nmero de xitos en
una intervencin quirrgica. Si voy a hacer 100 intervenciones quirrgicas, me interesa saber
el nmero de xitos de esas intervenciones.
Cundo vamos a aplicar una distribucin binomial?
Si sumamos todas estas variables, me va a dar el nmero de individuos, de xitos en n
pruebas. Este nmero de xitos en n pruebas se dice que sigue una distribucin binomial que
depende de dos parmetros:
n = el nmero de pruebas que haces.
P = probabilidad de xito en cada una de esas pruebas.
Esto tiene mucho que ver con cundo puedo utilizar esta distribucin binomial. Imaginaos que
aqu hay 90 personas, entonces, hay 45 chicas y 45 chicos. Yo saco a esta persona, cul es la
probabilidad que tengo de sacar a otra chica? Qu probabilidad tena de sacarla a ella? 45/90
= . Cul es la probabilidad de que saque a otra chica? 44/89 es la probabilidad que tengo de
sacar a otra chica. La probabilidad que tena de sacar a la primera persona no es igual que la
probabilidad que tena de sacar a la segunda persona. Puedo utilizar aqu la distribucin
binomial? NO. Tengo que utilizar otra distribucin diferente, porque en el primer experimento
las probabilidades son diferentes que en el segundo. Por lo que, los experimentos no son
independientes, ya que la probabilidad de sacar a una persona en un experimento es diferente
a la probabilidad que tengo de sacar a una persona en el siguiente experimento.
5
Seguimos en la misma situacin, 90 personas (45 chicos y 45 chicas). Cul es la probabilidad
de que saque a una chica? .
Qu significa esto? La situacin de Bernoulli la puedo aplicar a poblaciones cuando hago un
muestreo con reemplazamiento, as que la distribucin binomial la puedo utilizar cuando hago
un muestreo con reemplazamiento. Tambin la puedo utilizar en los muestreos sin
reemplazamiento, pero contando con la condicin de que la poblacin de la que est haciendo
el muestreo sea muy muy muy grande. Si tengo un milln de personas, la mitad son hombres y
la mitad son mujeres, y saco a una persona, Qu probabilidad tengo de sacar a una persona?
. Cul va a ser la probabilidad de que en la siguiente extraccin saque a otra persona? Muy
muy similar a , no igual, pero muy similar. As que, cundo puedo utilizar la distribucin de
Bernoulli? Siempre que haga un muestreo con reemplazamiento o siempre que muestree de
poblaciones muy grandes.
Qu valores puede tomar la distribucin binomial? La variable X que tiene una distribucin
binomial puede tomar valores siempre entre 0 y n. Si X sigue una distribucin binomial de
parmetros n y P, los valores que puede tomar X son siempre entre 0 y n. La funcin de
densidad o cuanta es esta que tenis aqu tan complicadita, que luego vamos a utilizar tablas y
no la vamos a usar. Implica combinaciones. Ya veremos cmo se utilizan las tablas.
La funcin de distribucin sera esta otra que tenemos aqu, esto sera cmo se calcula el
nmero combinatorio. No os voy a pedir que sepis esto. Estas seran las tablas. Os daremos
tablas para que aprendis a buscar esas probabilidades.
6
Lo que s que me interesa es que sepis que en la distribucin binomial, la esperanza
matemtica, la media de una distribucin de X cuando sta sigue una distribucin binomial es
siempre n x p. n que es el nmero de pruebas que hacemos x P.
Esto tiene que ver con lo siguiente. Si s que la probabilidad de xito en cada una de mis
intervenciones quirrgicas es de 0,25, y voy a hacer 100 intervenciones quirrgicas. Cuntos
xitos esperara tener? n x 0,25 = 25 xitos. Esta es la esperanza matemtica, es la media de
una distribucin binomial. Cul sera la desviacin estndar o la varianza de una distribucin
binomial, de una variable que recoge el nmero de xito en n pruebas? Varianza = n x p x q (n=
nmero de pruebas; P = probabilidad de xito en cada prueba; q= probabilidad de fracaso en
cada prueba). Cul sera la desviacin estndar? La raz cuadrada de n x p x q.
Con respecto a lo dado anteriormente, fundamental saber cmo son y dnde se utilizan en
medicina tanto el modelo de Bernoulli como el binomial; las funciones de densidad y de
distribucin de cada modelo, as como la esperanza matemtica y la varianza. (No es necesario
sabrsela las frmulas pero s saber identificar los datos en las tablas y en stata.)
El modelo ms utilizado es el binomial, seguido por la distribucin de Poisson y la distribucin
normal.
Grupo 28 09/03/2015
DISTRIBUCIN DE POISSON:
Es la distribucin discreta ms utilizada de la binomial. Es la distribucin de los sucesos muy
raros, en general con probabilidades p de ocurrir menores de 0.01 (p
7
enfermedad rara teniendo en cuenta a toda la poblacin que la puede contraer. Esta se puede
utilizar para estudiar la incidencia (la frecuencia) de las enfermedades.
Ejemplos:
Nmero de muertes atribuidas al hepatocarcinoma durante cierto periodo de tiempo.
Recuento de colonias de bacterias en la superficie de una placa de apgar.
Nmero de partculas radiactivas en determinado espacio.
Casos nuevos de cierta enfermedad en la poblacin de un municipio o rea geogrfica
pequea.
Todos los ejemplos anteriores son susceptibles de ser considerados como procesos de Poisson.
Adems, otras situaciones similares, caracterizadas por la observacin del nmero de sucesos
raros en un intervalo continuo de: tiempo, superficie, poblacin, longitud o espacio. Notar que
intervalo tiene sentido fsico no matemtico.
La variable aleatoria X es el recuento o nmero de sucesos que ocurren en determinado
intervalo t (de tiempo, poblacin, superficie, longitud o/y espacio).
Por ejemplo, suponemos un nmero de casos que se producen por unidad de superficie por
unidad de tiempo, es decir, se producen 2 casos de hepatocarcinoma por cada ao. Esto es la
tasa de incidencia de hepacardinoma en mi poblacin que es lo que vamos a denominar .
Pero si en vez un ao, les seguimos durante 5, ahora es 10. Vemos que cuando ms largo es
el periodo, mayor nmero de casos tenemos.
El proceso de poisson va depender de y de t (el periodo).
Se parte de algunas suposiciones sobre la incidencia del suceso del intervalo t. Dichas
suposiciones caracterizan los procesos de Poisson:
La probabilidad de observar un suceso es directamente proporcional al tamao del
intervalo t considerado. Es proporcional a t, siendo t la amplitud del intervalo
considerado, medido en unidades de tiempo, poblacin
Es una constante que caracteriza el proceso de poisson.
Es la tasa del nmero de sucesos que se realizan por unidad de tiempo,
superficie, poblacin, longitud o espacio.
>0. Si es igual a cero, la probabilidad es cero siempre. Si bien, este nmero
puede ser muy pequeo ya que estamos estudiando sucesos muy raros.
Podemos definir un subintervalo de t, infinitesimal t, tan pequeo como para que la
probabilidad de observar un suceso en t de sea prcticamente igual a 0. Como si redujsemos
la probabilidad de padecer hepatocarcioma en mi poblacin en un segundo. Este valor puede
que sea 0.
8
Hay suposiciones que caracterizan a los procesos de Poisson, estos son:
La independencia: las distribuciones de intervalos disjuntos son independientes.
La probabilidad de que X tome determinado valor en un intervalo, no depende
del valor de la variable en intervalos contiguos.
Este supuesto no se cumple en epidemiologa cuando se estudian
enfermedades transmisibles en situaciones epidmicas, tipo bola. El nmero
de casos de la enfermedad en un intervalo de tiempo, depende del nmero de
casos observados en el intervalo anterior. Es decir, que se adapta muy bien al
estudio de la incidencia del cncer pero no del bola.
Lo que ocurre en 1 cm2 de placa de apgar es independiente de lo que va a pasar
en 1 cm2 de apgar diferente.
Cada periodo de tiempo es independiente as si tenemos 25 casos de una
enfermedad transmisible en un ao, no significa que al ao siguiente vayamos a
tener los mismos casos, es ms por ser transmisible, habr una mayor incidencia.
La distribucin del nmero de sucesos depende de la amplitud del intervalo.
El nmero de sucesos por unidad de tiempo, poblacin, superficie, y/o espacio
es siempre la misma. (La probabilidad de los sucesos es la misma pero el
nmero de sucesos que ocurra puede ser diferente)
O de otra forma, si la amplitud de dos intervalos cualesquiera es idntica, la
probabilidad de observar un cierto nmero de sucesos en cualquier par de
ambos intervalos es la misma.
Esta suposicin no se cumple cuando la incidencia del suceso cambia con el
tiempo o cuando se consideran intervalos t muy amplios.
Si las suposiciones del proceso de Poisson se cumplen, la variable X, que es el nmero de casos
del intervalo t, toma valores enteros entre 0 e infinito. As decimos que sigue una distribucin
de Poisson de parmetro . es la tasa que es el nmero medio de sucesos por unidad.
La media o esperanza matemtica y la varianza 2 de X son la misma cantidad. Si =2 y t=5
aos. La = 10 (5x2) y la varianza tambin ser 10. (La desviacin estndar es La raz cuadrada
de 10)
Vemos que es el producto de la tasa por el nmero de unidades t.
La funcin de densidad de la distribucin de Poisson es:
9
La funcin de distribucin de la distribucin de Poisson es:
(No es necesario saberse las frmulas ya que vamos a poder obtener los datos de tablas y a
partir de STATA)
Por ejemplo, cul es la probabilidad de que x (el nmero de casos de la enfermedad) sea igual
a 3? Sabiendo que landa es 2 y t es 0,5 (medio ao). La media es 2x0.5=1
Vamos a la tabla y buscamos =1 y x=3. La interseccin nos da la probabilidad en este caso:
0.0613.
En cuanto a la funcin de distribucin, que es la probabilidad de tener 3 o menos casos, la
vamos a calcular sumando las probabilidades de X=0, X=1, X=2 y X=3. En este caso:
0.3679+0.3679+0.1839+0.0613= 0.981
10
DISTRIBUCIN NORMAL
La distribucin de normal es la principal distribucin para variables continuas en medicina. Al
ser continua, toma valores entre (- +)
Su funcin de densidad cumple todas las condiciones de una densidad f(x) para variables
continuas:
f(x) es siempre positiva
El rea bajo f(x) debe ser 1
La probabilidad entre dos puntos a y b es el rea bajo f(x) entre ambos.
Posee dos asntotas, una en cada extremo. Estos datos van a aproximarse al eje pero nunca
van a llegar a tener este valor.
La frmula es la siguiente:
Esta depende de la media de la variable x y de la desviacin estndar, por lo que vamos a tener
una distribucin normal diferente por cada valor.
Por lo que es una familia de distribuciones que tiene infinitos miembros. Pero hay una que nos
interesa mucho, cuando la media es 0 y la desviacin es 1. Esta es la distribucin normal
estndar o tipificada.
Por lo tanto la estandarizacin o tipificacin es la propiedad que me permite transformar
cualquier variable normal en una normal de media 0 y desviacin estndar 1.
-Si X es una variable aleatoria continua con distribucin:
11
- Entonces la variable estandarizada Z:
Ponemos un ejemplo: Si yo tengo un paciente con 220 de colesterol en sangre. El colesterol en
sangre en la poblacin sigue una media de 190 y una desviacin estndar de 5. Tipificando
estos valores, ahora tengo que mi media es 0 y mi desviacin es 1. As el 220 nos va a dar un
valor de 6.
Cul es la probabilidad de observar valores de 220 o menores? Tenemos que hallar F(220).
Esto es el rea desde menos infinito hasta 220. El rea total es 1 y nuestra rea es
prcticamente 1.
Anteriormente se dijo que un valor es raro cuando al estandarizarlo es mayor a 3 o menor a -3,
por lo que nuestro valor es muy raro ya que tenemos 6.
La probabilidad de observar valores iguales o menores a 220 est muy cerca de 1 y la
probabilidad de observar valores superiores a 220 es prcticamente 0. Esto quiere decir que la
mayor parte de la poblacin tiene valores iguales o menores de 220. En cuanto a la funcin de
distribucin es:
12
Grupo 28 10/03/2015
Podemos hallar las distribuciones normales en la tabla:
Si tenemos un paciente con 200 de colesterol en sangre.
Z= = 2
Para calcular la distribucin de densidad en la tabla, buscamos el valor. Si Z=2 buscamos la
interseccin con el 0,00 y nos da la probabilidad. En este caso: 0.9773
Esto quiere decir que la probabilidad de observar valores por debajo de 200 es del 97%.
13
Como vemos en el siguiente todas las distribuciones pueden aproximarse a la distribucin
normal, por eso esta ocupa una posicin central. Si bien esta tambin puede aproximarse a la
distribucin normal (0,1).
Vamos a buscar las funciones de densidad y de distribucin en STATA y en las tablas.
En el caso de la DISTRIBUCIN BINOMIAL:
Como ya sabemos la distribucin binomial depende de dos parmetros: n (nmero de
pruebas) y de p (probabilidad de xito)
FUNCIN DE DENSIDAD:
TABLA:
Buscamos nuestro nmero de casos (n) y x que es el valor que nos interesa saber. Buscamos la
probabilidad en la columna horizontal y la interseccin nos dar la probabilidad que buscamos.
Por ejemplo, si tengo 5 pacientes con el mismo tratamiento y s que en estudios anteriores la
probabilidad de xito es del 0.05. Cul es la probabilidad de que con 5 pruebas obtenga 3
xitos? Buscamos en la tabla n=5 p=0.05 y x=3. La probabilidad nos da 0.0011.
STATA:
Utilizamos el comando:
di binomialp(n,x,p)"
Ejemplo: di " X=Bi(n=25, p=0.2); f(3)=P[X=3]= binomialp(n,x,p)=binomialp(25,3,0.2)="
binomialp(25,3,0.2)
14
De nuestro ejemplo anterior de 5 pruebas, 3 xitos, 0.05 probabilidad de xito en cada prueba.
Si mi x tiene que tomar el valor 3.
Introducimos en STATA: Di binomialp(5,3,0.05) y nos da 0.001128.
FUNCIN DE DISTRIBUCIN:
TABLA:
Realizamos el mismo procedimiento que en el caso de que se tratase de una distribucin de
densidad pero ahora sumamos las probabiliades que nos pidan.
Por ejemplo, si ahora quiero saber la probabilidad de observar 3 xitos o menos, voy a la tabla
y miro tabla n=5 p=0.05 y x=0, x=1, x=2, x=3.
STATA:
Si lo calculamos con STATA, no hara falta que lo sumsemos sino que nos lo da ya si
introducimos el comando siguiente:
di binomial(n,k,p)
Ejemplo: di " X=Bi(n=25, p=0.2); F(3)=P[X
15
Utilizamos el comando:
poissonp(,x)"
Ejemplo:
di"X=Po(m=lamda*t=2.3);f(3)=P[X=3]=poissonp(m,x)=poissonp(2.3,3)="poissonp(2.3,3)
En el nuestro: diX=Po(2);f(3)=P(X=3)=poissonp(2,3)= poisson(2,3) = 0.1804
(Aunque para meter el comando en STATA ponemos poisson(2,2)
FUNCIN DE DISTRIBUCIN
Cul es la probabilidad de observar 2 o menos casos?
TABLA:
Buscamos =2 y x=0, x=1 y x=2. Sumamos los valores y obtenemos la probabilidad.
STATA:
Utilizamos el comando:
poisson(,k)"
Ejemplo: di"X=Po(m=lamda*t=2.3);F(3)=P[X
16
F(190)=P[x190]=P[((X-190)/10 ) ((190-190)/10)]
La distribucin normal es simtrica y la moda, media y mediana coinciden. Por tanto, la
probabilidad de que una distribucin normal tome valores menores o iguales a la media es de
0.5. Asimismo, la probabilidad de observar valores superiores a 190 sera 0.5.
El nivel de colesterol de un paciente es x=200. Qu valor percentil es 200? O lo que es lo
mismo, qu valor queda por debajo de 200?
Si esta probabilidad fuera del 60%, 200 sera el percentil 60. Los valores superiores a 200 se
hallaran calculando la funcin de supervivencia, es decir, 1- funcin de distribucin.
Para calcular esa probabilidad con STATA debemos escribir en la barra de comandos:
Di X=N(190,10); F(200)=P[x
17
Binomial a la de Poisson y las probabilidades calculadas a partir de la binomial sern muy
similares a las calculadas a partir de Poisson.
En el caso que se muestra a continuacin, X sigue una distribucin Bi (100, 0.01) y,
consecuentemente, podremos aproximarla a Poisson.
Las barras azules muestran la funcin de densidad Bi (100.0.01) y las barras rojas la
distribucin de Poisson de media 1. Esta media ha sido obtenida multiplicando nxp de la
binomial, es decir, 100x0.01. Al aproximar las distribuciones, las probabilidades calculadas en
la distribucin de Poisson y la binomial sern muy parecidas.
EXAMEN CORREGIDO EN CLASE (MIRCOLES 11 DE MARZO)
1. La probabilidad de sobrevivir a una intervencin quirrgica por un cncer de pulmn
despus de 5 aos en una determinada poblacin es del 25%. Durante el prximo
mes se intervendrn a 100 pacientes.
a) Calcula la probabilidad de que solo sobrevivan 10 pacientes.
b) Calcula la probabilidad de que sobrevivan 10 o menos.
c) Durante la prxima semana vamos a intervenir a 7 pacientes:
- Calcula la probabilidad de que sobrevivan todos.
- Calcula la probabilidad de que sobrevivan solamente 5.
- Calcula la probabilidad de que sobrevivan 3 o menos.
Nota*: los ejercicios no se resolvieron en el orden del enunciado.
En primer lugar hay que escoger la distribucin estadstica adecuada para la situacin.
Al tratarse de una situacin mdica en la que realizamos experimentos idnticos (en
este caso, realizar la misma intervencin quirrgica), utilizaremos el modelo binomial.
18
La distribucin binomial depende de dos parmetros:
- n: en esta distribucin se repite un experimento de Bernoulli n veces de forma
independiente e idntica. Por lo tanto, n hace referencia al nmero de
experimentos realizados.
- p: es la probabilidad de xito de sobrevivir en cada una de las pruebas, es
decir, la proporcin de individuos que sobreviven.
Al principio p es desconocida para nosotros y para determinarla se debe
realizar un experimento con n individuos y calcular la probabilidad de
supervivencia de estos. Suponemos que cada paciente que intervendremos
tendr a misma probabilidad de supervivencia. En nuestro caso, tal y como
dice el enunciado, la probabilidad de xito (p) es de 0,25 (recordemos que la
probabilidad se mide en una escala de 0-1)
C) Se intervienen a 7 pacientes
n=7.
Creamos una variable indicadora de la situacin que queremos estudiar. De esta forma
las variables X1, X2, X3... Xn tomarn valores 0 o 1 segn hayan sobrevivido o no:
X1= 0, el paciente nmero 1 NO sobrevive.
X1=1, el paciente sobrevive a los 5 aos.
Asignamos un valor 1 a los pacientes que sobreviven ya que es lo que nos interesa
analizar. De lo contrario, si quisiramos conocer cuntos individuos mueren, los
valores habran sido asignados al revs (0 a los pacientes que sobreviven y 1 a los que
mueren).
A continuacin contaremos el nmero de supervivientes para determinar la variable X.
La variable X es la suma de todas las Xi. Mientras que X1, X2, X3... Xn siguen una
distribucin de Bernoulli, X sigue una distribucin binomial.
En este caso la distribucin binomial sera Bi (7, 0.25).
Para calcular la probabilidad de que sobrevivan los 7 pacientes utilizamos la funcin de
densidad o cuanta ya que determina la probabilidad de que el nmero de
supervivientes sea igual a un determinado valor x. La probabilidad de que X fuera
exactamente igual a 7.
Para hallar esta probabilidad se puede aplicar la frmula de la funcin de densidad o
cuanta en la distribucin binomial, se puede encontrar en las tablas de esta
distribucin o mediante el programa STATA. Los tres mtodos deben dar el mismo
resultado:
Miramos en la tabla de la distribucin binomial teniendo en cuenta que n=7 y
p=0.25.
Escribimos di binomialp(7,7,0.25) en el apartado de comandos de STATA.
El resultado es 0.0001 (puede que no sea exactamente igual porque en las tablas se
redondea). Es una probabilidad muy baja.
Probabilidad de que sobrevivan solamente?
19
- Miramos en la tabla teniendo en cuenta que n=7 , x=5 y p=0.25 Resultado: 0.0015.
- Escribimos di binomialp(7,5,0.25) en el apartado de comandos de STATA. Resultado:
0.0015
Cul sera el nmero esperado de supervivientes cuando hacemos las 7
operaciones?
Hay que hallar la esperanza matemtica o la media de una binomial multiplicando el
nmero de operaciones por la probabilidad:
nxp=7x0.25=1.75, esperamos que sobrevivan 1 o 2 pacientes como mucho.
Cul sera la varianza de x? nxpxq=1.31
Y la desviacin estndar? 1.31= 1.14
Tambin podemos utilizar STATA para hallarlo:
- Calcular la esperanza: di7*0.25
- Calculamos varianza: divarianza7*0.25*0.75
Cul sera la esperanza matemtica de la variable x si realizamos 100 pruebas?
Cuando tratamos con un nmero grande de pruebas (en general mayor que 30), la media (nxp)
es mayor que 5 y nx(1-p) tambin es mayor que 5 , podemos aproximar la distribucin
binomial a la normal. No obstante, tambin se puede resolver siguiendo el procedimiento
utilizado en los ejercicios anteriores.
La distribucin normal depende de 2 parametros: la media y la desviacin estndar. La media
se halla multiplicando nxp y la desviacin estndar se obtiene haciendo (nxpxq).
Cuando n=100, x puede tomar valores desde el 0 hasta el 100. Cada uno de esos valores tiene
una probabilidad.
La imagen muestra un diagrama de barras y en l observamos que cada valor tiene su
probabilidad. En este caso, la distribucin binomial est centrada en 50 porque esa es la
media.
Sin embargo, nuestra distribucin binomial estara centrada en 25 y la desviacin estndar
sera de 4,33.
20
Ahora utilizaremos la distribucin normal para calcular las siguientes probabilidades:
Probabilidad de que sobrevivan 10 o menos:
di binomial (100,10,0.25)=0.00013
X Bi(100,0.25) N (25,4.33)
F(10)= P[X10]=P[N(25,4.33)10.5]
Estandarizamos:
F(10)=P [((x-25)/4.33) ((10.5-25)/4.33)]
P=0.00040606
Probabilidad de observar solo 10
P[X=10]=P[9.5 X 10.5]= P[((9.5-25)/4.33) ((X-25)/4.33) ((10.5-25)/4.33)]
Utilizando STATA, tendramos que poner en la barra de comandos:
dinormal((10.5-25/4.33)-normal((9.5-25)/4.33)
Resultado= 0.000239
Probabilidad de que sobrevivan 5
n=7, x=5, p=0.0115
dis binomial(7,5,0.25)
Resultado=0.01153
Cul ser el nmero de superivientes?
=nxp=7x0.25=1.25
Utilizando STATA:
di 7*0.25=
Cul sera la varianza?
divarianza7*0.25*0.25
Resultado=1.3125
NOTA*: Las ltimas diapositivas del Power Point no se vieron en clase.