Transcript
  • 1

    Grupos 24 y 28 04/03/2015

    TEMA 7: MODELOS TERICOS DE PROBABILIDAD

    Los modelos tericos de probabilidad son una serie de funciones de densidad y de distribucin,

    y son para una serie de variables que van a aparecer muchsimas veces en medicina.

    DISTRIBUCIN DE BERNOULLI

    Tenemos a nuestro paciente, entra a nuestra consulta y este paciente puede estar enfermo o

    puede estar sano. Este es el experimento ms sencillo que podemos tener.

    Elegir una persona de la poblacin y que est enfermo. P es la prevalencia de la enfermedad

    en la poblacin de la que procede ese enfermo. Y tenemos tambin que aplicar un tratamiento

    a un enfermo, podra ser obtener un xito (curarle) o un fracaso. Vas a intervenir

    quirrgicamente a un paciente, puedes tener un xito o un fracaso.

    Sucesos del espacio muestral omega: E es estar enfermo o tener un xito en la curacin del

    paciente. E complementario, que sera el F, es estar sano o no curar al paciente.

    Creamos ahora una variable aleatoria, X discreta que tome slo dos resultados. Si el resultado

    es un xito esta variable va a tomar valor 1, y si es un fracaso va a tomar valor 0. Esta es una

  • 2

    variable indicador, indica que ha ocurrido algo. Ha ocurrido un xito, ha ocurrido que este

    paciente tena la enfermedad, o ha ocurrido que este paciente se ha curado. Da igual, pero

    puedo utilizar esta variable para sealar multitud de sucesos.

    Esta variable de Bernoulli, esta variable X, tiene una funcin de cuanta. Cul es esta funcin

    de cuanta? Este paciente va a tener la enfermedad con una prevalencia P, esta P es la

    probabilidad de obtener un xito, una curacin o estar enfermo. Si esto es estar enfermo, esta

    P es la prevalencia de la enfermedad, pero si esto es tener un xito en la operacin, lo que

    tengo que hacer previamente es estudiar qu es lo que ha pasado con varios individuos a los

    cuales les hayamos hecho la misma operacin y ver cul es esta frecuencia relativa de xito

    que sera P.

    Cul sera la probabilidad de no tener un xito? Estamos aplicando una norma de

    probabilidad. Si tenemos un suceso, cul es la probabilidad de que no ocurra ese suceso, pues

    1 menos la probabilidad de que ocurra. Tenemos P, y a este 1 P se le denomina Q y sera la

    probabilidad de no curar o de no tener la enfermedad. Es un experimento, es coger a un

    individuo y ste puede o no tener la enfermedad. Se le interviene, y se analiza cul es la

    probabilidad de obtener un xito o un fracaso en esa intervencin. Es el experimento que se

    hace constantemente en clnica.

    *p = probabilidad de xito y q =probabilidad de un fracaso.

    Esto es la variable de Bernoulli. Esto es para un individuo. Qu va a pasar entonces cuando

    nosotros tenemos varios individuos? Bueno, fijaos, decimos entonces que X sigue una

    distribucin de Bernoulli, cuando tenemos una situacin de un solo individuo y tenemos un

    xito o un fracaso, solamente decimos que X sigue una distribucin de Bernoulli. En este tipo

    de experimentos con resultados dicotmicos, la distribucin de la variable queda

    completamente determinada conociendo el parmetro P.

  • 3

    La media o esperanza de X (siendo X la variable de Bernoulli), sera p, y la varianza sera p x q

    (esto s que lo tenis que saber). Hay que saber de cada una de las distribuciones cul es la

    funcin de densidad, de distribucin, y por supuesto cul es la media y la varianza. Si la

    varianza es p x q, la desviacin estndar sera la raz cuadrada de p x q. As que ya tenemos la

    distribucin de Bernoulli, la cual es para una variable que solo puede tomar dos valores: 0 1.

    DISTRIBUCIN BINOMIAL

    En lugar de hacer un experimento con un paciente, ahora vamos a hacer n experimentos.

    Fijaos, voy a coger a mi paciente nmero 1, nmero 2, nmero 3 y nmero n. Para cada

    paciente vamos a crear una variable de Bernoulli, X1, X2, X3, Xn. Aqu todas son maysculas

    porque son los indicativos o nombres de las variables. Esta variable, va a tomar valor 1 0, y

    esta otra variable X2 va a tomar valor 1 0 dependiendo de las caractersticas de este

    paciente. En lugar de tener una distribucin de Bernoulli solamente, vamos a tener n

    distribuciones de Bernoulli, una para cada uno de los pacientes.

    Voy a crear una variable X que va a ser la suma de X1 + X2 + Xn.

    Si digo, quiero contar los individuos que tienen aqu esta caracterstica, que son naranjas.

    Imaginemos que los naranjas son los aos. Cundo va a tomar valor 1 la variable X1? Cuando

    este individuo sea naranja. En este caso X1 va a ser igual a 1. Qu valor va a tomar X2? Va a

    tomar el valor 0 porque no es naranja. Si yo quiero contar los naranjas, X3 va a tomar valor 1.

    Si yo voy a sumar X1, X2 y X3 (variables que solamente toman valor 0 1).

    Si quiero contar los individuos de color rojo, el que sea naranja ser 0, X2 sera 1 y X3 sera 0. A

    si que, cuando sumo todas las variables lo que obtengo es el nmero de individuos que tienen

    una determinada caracterstica o el nmero de xitos que tengo en n pruebas.

  • 4

    Esto se aplica en medicina? S, se aplica continuamente, por ejemplo el nmero de xitos en

    una intervencin quirrgica. Si voy a hacer 100 intervenciones quirrgicas, me interesa saber

    el nmero de xitos de esas intervenciones.

    Cundo vamos a aplicar una distribucin binomial?

    Si sumamos todas estas variables, me va a dar el nmero de individuos, de xitos en n

    pruebas. Este nmero de xitos en n pruebas se dice que sigue una distribucin binomial que

    depende de dos parmetros:

    n = el nmero de pruebas que haces.

    P = probabilidad de xito en cada una de esas pruebas.

    Esto tiene mucho que ver con cundo puedo utilizar esta distribucin binomial. Imaginaos que

    aqu hay 90 personas, entonces, hay 45 chicas y 45 chicos. Yo saco a esta persona, cul es la

    probabilidad que tengo de sacar a otra chica? Qu probabilidad tena de sacarla a ella? 45/90

    = . Cul es la probabilidad de que saque a otra chica? 44/89 es la probabilidad que tengo de

    sacar a otra chica. La probabilidad que tena de sacar a la primera persona no es igual que la

    probabilidad que tena de sacar a la segunda persona. Puedo utilizar aqu la distribucin

    binomial? NO. Tengo que utilizar otra distribucin diferente, porque en el primer experimento

    las probabilidades son diferentes que en el segundo. Por lo que, los experimentos no son

    independientes, ya que la probabilidad de sacar a una persona en un experimento es diferente

    a la probabilidad que tengo de sacar a una persona en el siguiente experimento.

  • 5

    Seguimos en la misma situacin, 90 personas (45 chicos y 45 chicas). Cul es la probabilidad

    de que saque a una chica? .

    Qu significa esto? La situacin de Bernoulli la puedo aplicar a poblaciones cuando hago un

    muestreo con reemplazamiento, as que la distribucin binomial la puedo utilizar cuando hago

    un muestreo con reemplazamiento. Tambin la puedo utilizar en los muestreos sin

    reemplazamiento, pero contando con la condicin de que la poblacin de la que est haciendo

    el muestreo sea muy muy muy grande. Si tengo un milln de personas, la mitad son hombres y

    la mitad son mujeres, y saco a una persona, Qu probabilidad tengo de sacar a una persona?

    . Cul va a ser la probabilidad de que en la siguiente extraccin saque a otra persona? Muy

    muy similar a , no igual, pero muy similar. As que, cundo puedo utilizar la distribucin de

    Bernoulli? Siempre que haga un muestreo con reemplazamiento o siempre que muestree de

    poblaciones muy grandes.

    Qu valores puede tomar la distribucin binomial? La variable X que tiene una distribucin

    binomial puede tomar valores siempre entre 0 y n. Si X sigue una distribucin binomial de

    parmetros n y P, los valores que puede tomar X son siempre entre 0 y n. La funcin de

    densidad o cuanta es esta que tenis aqu tan complicadita, que luego vamos a utilizar tablas y

    no la vamos a usar. Implica combinaciones. Ya veremos cmo se utilizan las tablas.

    La funcin de distribucin sera esta otra que tenemos aqu, esto sera cmo se calcula el

    nmero combinatorio. No os voy a pedir que sepis esto. Estas seran las tablas. Os daremos

    tablas para que aprendis a buscar esas probabilidades.

  • 6

    Lo que s que me interesa es que sepis que en la distribucin binomial, la esperanza

    matemtica, la media de una distribucin de X cuando sta sigue una distribucin binomial es

    siempre n x p. n que es el nmero de pruebas que hacemos x P.

    Esto tiene que ver con lo siguiente. Si s que la probabilidad de xito en cada una de mis

    intervenciones quirrgicas es de 0,25, y voy a hacer 100 intervenciones quirrgicas. Cuntos

    xitos esperara tener? n x 0,25 = 25 xitos. Esta es la esperanza matemtica, es la media de

    una distribucin binomial. Cul sera la desviacin estndar o la varianza de una distribucin

    binomial, de una variable que recoge el nmero de xito en n pruebas? Varianza = n x p x q (n=

    nmero de pruebas; P = probabilidad de xito en cada prueba; q= probabilidad de fracaso en

    cada prueba). Cul sera la desviacin estndar? La raz cuadrada de n x p x q.

    Con respecto a lo dado anteriormente, fundamental saber cmo son y dnde se utilizan en

    medicina tanto el modelo de Bernoulli como el binomial; las funciones de densidad y de

    distribucin de cada modelo, as como la esperanza matemtica y la varianza. (No es necesario

    sabrsela las frmulas pero s saber identificar los datos en las tablas y en stata.)

    El modelo ms utilizado es el binomial, seguido por la distribucin de Poisson y la distribucin

    normal.

    Grupo 28 09/03/2015

    DISTRIBUCIN DE POISSON:

    Es la distribucin discreta ms utilizada de la binomial. Es la distribucin de los sucesos muy

    raros, en general con probabilidades p de ocurrir menores de 0.01 (p

  • 7

    enfermedad rara teniendo en cuenta a toda la poblacin que la puede contraer. Esta se puede

    utilizar para estudiar la incidencia (la frecuencia) de las enfermedades.

    Ejemplos:

    Nmero de muertes atribuidas al hepatocarcinoma durante cierto periodo de tiempo.

    Recuento de colonias de bacterias en la superficie de una placa de apgar.

    Nmero de partculas radiactivas en determinado espacio.

    Casos nuevos de cierta enfermedad en la poblacin de un municipio o rea geogrfica

    pequea.

    Todos los ejemplos anteriores son susceptibles de ser considerados como procesos de Poisson.

    Adems, otras situaciones similares, caracterizadas por la observacin del nmero de sucesos

    raros en un intervalo continuo de: tiempo, superficie, poblacin, longitud o espacio. Notar que

    intervalo tiene sentido fsico no matemtico.

    La variable aleatoria X es el recuento o nmero de sucesos que ocurren en determinado

    intervalo t (de tiempo, poblacin, superficie, longitud o/y espacio).

    Por ejemplo, suponemos un nmero de casos que se producen por unidad de superficie por

    unidad de tiempo, es decir, se producen 2 casos de hepatocarcinoma por cada ao. Esto es la

    tasa de incidencia de hepacardinoma en mi poblacin que es lo que vamos a denominar .

    Pero si en vez un ao, les seguimos durante 5, ahora es 10. Vemos que cuando ms largo es

    el periodo, mayor nmero de casos tenemos.

    El proceso de poisson va depender de y de t (el periodo).

    Se parte de algunas suposiciones sobre la incidencia del suceso del intervalo t. Dichas

    suposiciones caracterizan los procesos de Poisson:

    La probabilidad de observar un suceso es directamente proporcional al tamao del

    intervalo t considerado. Es proporcional a t, siendo t la amplitud del intervalo

    considerado, medido en unidades de tiempo, poblacin

    Es una constante que caracteriza el proceso de poisson.

    Es la tasa del nmero de sucesos que se realizan por unidad de tiempo,

    superficie, poblacin, longitud o espacio.

    >0. Si es igual a cero, la probabilidad es cero siempre. Si bien, este nmero

    puede ser muy pequeo ya que estamos estudiando sucesos muy raros.

    Podemos definir un subintervalo de t, infinitesimal t, tan pequeo como para que la

    probabilidad de observar un suceso en t de sea prcticamente igual a 0. Como si redujsemos

    la probabilidad de padecer hepatocarcioma en mi poblacin en un segundo. Este valor puede

    que sea 0.

  • 8

    Hay suposiciones que caracterizan a los procesos de Poisson, estos son:

    La independencia: las distribuciones de intervalos disjuntos son independientes.

    La probabilidad de que X tome determinado valor en un intervalo, no depende

    del valor de la variable en intervalos contiguos.

    Este supuesto no se cumple en epidemiologa cuando se estudian

    enfermedades transmisibles en situaciones epidmicas, tipo bola. El nmero

    de casos de la enfermedad en un intervalo de tiempo, depende del nmero de

    casos observados en el intervalo anterior. Es decir, que se adapta muy bien al

    estudio de la incidencia del cncer pero no del bola.

    Lo que ocurre en 1 cm2 de placa de apgar es independiente de lo que va a pasar

    en 1 cm2 de apgar diferente.

    Cada periodo de tiempo es independiente as si tenemos 25 casos de una

    enfermedad transmisible en un ao, no significa que al ao siguiente vayamos a

    tener los mismos casos, es ms por ser transmisible, habr una mayor incidencia.

    La distribucin del nmero de sucesos depende de la amplitud del intervalo.

    El nmero de sucesos por unidad de tiempo, poblacin, superficie, y/o espacio

    es siempre la misma. (La probabilidad de los sucesos es la misma pero el

    nmero de sucesos que ocurra puede ser diferente)

    O de otra forma, si la amplitud de dos intervalos cualesquiera es idntica, la

    probabilidad de observar un cierto nmero de sucesos en cualquier par de

    ambos intervalos es la misma.

    Esta suposicin no se cumple cuando la incidencia del suceso cambia con el

    tiempo o cuando se consideran intervalos t muy amplios.

    Si las suposiciones del proceso de Poisson se cumplen, la variable X, que es el nmero de casos

    del intervalo t, toma valores enteros entre 0 e infinito. As decimos que sigue una distribucin

    de Poisson de parmetro . es la tasa que es el nmero medio de sucesos por unidad.

    La media o esperanza matemtica y la varianza 2 de X son la misma cantidad. Si =2 y t=5

    aos. La = 10 (5x2) y la varianza tambin ser 10. (La desviacin estndar es La raz cuadrada

    de 10)

    Vemos que es el producto de la tasa por el nmero de unidades t.

    La funcin de densidad de la distribucin de Poisson es:

  • 9

    La funcin de distribucin de la distribucin de Poisson es:

    (No es necesario saberse las frmulas ya que vamos a poder obtener los datos de tablas y a

    partir de STATA)

    Por ejemplo, cul es la probabilidad de que x (el nmero de casos de la enfermedad) sea igual

    a 3? Sabiendo que landa es 2 y t es 0,5 (medio ao). La media es 2x0.5=1

    Vamos a la tabla y buscamos =1 y x=3. La interseccin nos da la probabilidad en este caso:

    0.0613.

    En cuanto a la funcin de distribucin, que es la probabilidad de tener 3 o menos casos, la

    vamos a calcular sumando las probabilidades de X=0, X=1, X=2 y X=3. En este caso:

    0.3679+0.3679+0.1839+0.0613= 0.981

  • 10

    DISTRIBUCIN NORMAL

    La distribucin de normal es la principal distribucin para variables continuas en medicina. Al

    ser continua, toma valores entre (- +)

    Su funcin de densidad cumple todas las condiciones de una densidad f(x) para variables

    continuas:

    f(x) es siempre positiva

    El rea bajo f(x) debe ser 1

    La probabilidad entre dos puntos a y b es el rea bajo f(x) entre ambos.

    Posee dos asntotas, una en cada extremo. Estos datos van a aproximarse al eje pero nunca

    van a llegar a tener este valor.

    La frmula es la siguiente:

    Esta depende de la media de la variable x y de la desviacin estndar, por lo que vamos a tener

    una distribucin normal diferente por cada valor.

    Por lo que es una familia de distribuciones que tiene infinitos miembros. Pero hay una que nos

    interesa mucho, cuando la media es 0 y la desviacin es 1. Esta es la distribucin normal

    estndar o tipificada.

    Por lo tanto la estandarizacin o tipificacin es la propiedad que me permite transformar

    cualquier variable normal en una normal de media 0 y desviacin estndar 1.

    -Si X es una variable aleatoria continua con distribucin:

  • 11

    - Entonces la variable estandarizada Z:

    Ponemos un ejemplo: Si yo tengo un paciente con 220 de colesterol en sangre. El colesterol en

    sangre en la poblacin sigue una media de 190 y una desviacin estndar de 5. Tipificando

    estos valores, ahora tengo que mi media es 0 y mi desviacin es 1. As el 220 nos va a dar un

    valor de 6.

    Cul es la probabilidad de observar valores de 220 o menores? Tenemos que hallar F(220).

    Esto es el rea desde menos infinito hasta 220. El rea total es 1 y nuestra rea es

    prcticamente 1.

    Anteriormente se dijo que un valor es raro cuando al estandarizarlo es mayor a 3 o menor a -3,

    por lo que nuestro valor es muy raro ya que tenemos 6.

    La probabilidad de observar valores iguales o menores a 220 est muy cerca de 1 y la

    probabilidad de observar valores superiores a 220 es prcticamente 0. Esto quiere decir que la

    mayor parte de la poblacin tiene valores iguales o menores de 220. En cuanto a la funcin de

    distribucin es:

  • 12

    Grupo 28 10/03/2015

    Podemos hallar las distribuciones normales en la tabla:

    Si tenemos un paciente con 200 de colesterol en sangre.

    Z= = 2

    Para calcular la distribucin de densidad en la tabla, buscamos el valor. Si Z=2 buscamos la

    interseccin con el 0,00 y nos da la probabilidad. En este caso: 0.9773

    Esto quiere decir que la probabilidad de observar valores por debajo de 200 es del 97%.

  • 13

    Como vemos en el siguiente todas las distribuciones pueden aproximarse a la distribucin

    normal, por eso esta ocupa una posicin central. Si bien esta tambin puede aproximarse a la

    distribucin normal (0,1).

    Vamos a buscar las funciones de densidad y de distribucin en STATA y en las tablas.

    En el caso de la DISTRIBUCIN BINOMIAL:

    Como ya sabemos la distribucin binomial depende de dos parmetros: n (nmero de

    pruebas) y de p (probabilidad de xito)

    FUNCIN DE DENSIDAD:

    TABLA:

    Buscamos nuestro nmero de casos (n) y x que es el valor que nos interesa saber. Buscamos la

    probabilidad en la columna horizontal y la interseccin nos dar la probabilidad que buscamos.

    Por ejemplo, si tengo 5 pacientes con el mismo tratamiento y s que en estudios anteriores la

    probabilidad de xito es del 0.05. Cul es la probabilidad de que con 5 pruebas obtenga 3

    xitos? Buscamos en la tabla n=5 p=0.05 y x=3. La probabilidad nos da 0.0011.

    STATA:

    Utilizamos el comando:

    di binomialp(n,x,p)"

    Ejemplo: di " X=Bi(n=25, p=0.2); f(3)=P[X=3]= binomialp(n,x,p)=binomialp(25,3,0.2)="

    binomialp(25,3,0.2)

  • 14

    De nuestro ejemplo anterior de 5 pruebas, 3 xitos, 0.05 probabilidad de xito en cada prueba.

    Si mi x tiene que tomar el valor 3.

    Introducimos en STATA: Di binomialp(5,3,0.05) y nos da 0.001128.

    FUNCIN DE DISTRIBUCIN:

    TABLA:

    Realizamos el mismo procedimiento que en el caso de que se tratase de una distribucin de

    densidad pero ahora sumamos las probabiliades que nos pidan.

    Por ejemplo, si ahora quiero saber la probabilidad de observar 3 xitos o menos, voy a la tabla

    y miro tabla n=5 p=0.05 y x=0, x=1, x=2, x=3.

    STATA:

    Si lo calculamos con STATA, no hara falta que lo sumsemos sino que nos lo da ya si

    introducimos el comando siguiente:

    di binomial(n,k,p)

    Ejemplo: di " X=Bi(n=25, p=0.2); F(3)=P[X

  • 15

    Utilizamos el comando:

    poissonp(,x)"

    Ejemplo:

    di"X=Po(m=lamda*t=2.3);f(3)=P[X=3]=poissonp(m,x)=poissonp(2.3,3)="poissonp(2.3,3)

    En el nuestro: diX=Po(2);f(3)=P(X=3)=poissonp(2,3)= poisson(2,3) = 0.1804

    (Aunque para meter el comando en STATA ponemos poisson(2,2)

    FUNCIN DE DISTRIBUCIN

    Cul es la probabilidad de observar 2 o menos casos?

    TABLA:

    Buscamos =2 y x=0, x=1 y x=2. Sumamos los valores y obtenemos la probabilidad.

    STATA:

    Utilizamos el comando:

    poisson(,k)"

    Ejemplo: di"X=Po(m=lamda*t=2.3);F(3)=P[X

  • 16

    F(190)=P[x190]=P[((X-190)/10 ) ((190-190)/10)]

    La distribucin normal es simtrica y la moda, media y mediana coinciden. Por tanto, la

    probabilidad de que una distribucin normal tome valores menores o iguales a la media es de

    0.5. Asimismo, la probabilidad de observar valores superiores a 190 sera 0.5.

    El nivel de colesterol de un paciente es x=200. Qu valor percentil es 200? O lo que es lo

    mismo, qu valor queda por debajo de 200?

    Si esta probabilidad fuera del 60%, 200 sera el percentil 60. Los valores superiores a 200 se

    hallaran calculando la funcin de supervivencia, es decir, 1- funcin de distribucin.

    Para calcular esa probabilidad con STATA debemos escribir en la barra de comandos:

    Di X=N(190,10); F(200)=P[x

  • 17

    Binomial a la de Poisson y las probabilidades calculadas a partir de la binomial sern muy

    similares a las calculadas a partir de Poisson.

    En el caso que se muestra a continuacin, X sigue una distribucin Bi (100, 0.01) y,

    consecuentemente, podremos aproximarla a Poisson.

    Las barras azules muestran la funcin de densidad Bi (100.0.01) y las barras rojas la

    distribucin de Poisson de media 1. Esta media ha sido obtenida multiplicando nxp de la

    binomial, es decir, 100x0.01. Al aproximar las distribuciones, las probabilidades calculadas en

    la distribucin de Poisson y la binomial sern muy parecidas.

    EXAMEN CORREGIDO EN CLASE (MIRCOLES 11 DE MARZO)

    1. La probabilidad de sobrevivir a una intervencin quirrgica por un cncer de pulmn

    despus de 5 aos en una determinada poblacin es del 25%. Durante el prximo

    mes se intervendrn a 100 pacientes.

    a) Calcula la probabilidad de que solo sobrevivan 10 pacientes.

    b) Calcula la probabilidad de que sobrevivan 10 o menos.

    c) Durante la prxima semana vamos a intervenir a 7 pacientes:

    - Calcula la probabilidad de que sobrevivan todos.

    - Calcula la probabilidad de que sobrevivan solamente 5.

    - Calcula la probabilidad de que sobrevivan 3 o menos.

    Nota*: los ejercicios no se resolvieron en el orden del enunciado.

    En primer lugar hay que escoger la distribucin estadstica adecuada para la situacin.

    Al tratarse de una situacin mdica en la que realizamos experimentos idnticos (en

    este caso, realizar la misma intervencin quirrgica), utilizaremos el modelo binomial.

  • 18

    La distribucin binomial depende de dos parmetros:

    - n: en esta distribucin se repite un experimento de Bernoulli n veces de forma

    independiente e idntica. Por lo tanto, n hace referencia al nmero de

    experimentos realizados.

    - p: es la probabilidad de xito de sobrevivir en cada una de las pruebas, es

    decir, la proporcin de individuos que sobreviven.

    Al principio p es desconocida para nosotros y para determinarla se debe

    realizar un experimento con n individuos y calcular la probabilidad de

    supervivencia de estos. Suponemos que cada paciente que intervendremos

    tendr a misma probabilidad de supervivencia. En nuestro caso, tal y como

    dice el enunciado, la probabilidad de xito (p) es de 0,25 (recordemos que la

    probabilidad se mide en una escala de 0-1)

    C) Se intervienen a 7 pacientes

    n=7.

    Creamos una variable indicadora de la situacin que queremos estudiar. De esta forma

    las variables X1, X2, X3... Xn tomarn valores 0 o 1 segn hayan sobrevivido o no:

    X1= 0, el paciente nmero 1 NO sobrevive.

    X1=1, el paciente sobrevive a los 5 aos.

    Asignamos un valor 1 a los pacientes que sobreviven ya que es lo que nos interesa

    analizar. De lo contrario, si quisiramos conocer cuntos individuos mueren, los

    valores habran sido asignados al revs (0 a los pacientes que sobreviven y 1 a los que

    mueren).

    A continuacin contaremos el nmero de supervivientes para determinar la variable X.

    La variable X es la suma de todas las Xi. Mientras que X1, X2, X3... Xn siguen una

    distribucin de Bernoulli, X sigue una distribucin binomial.

    En este caso la distribucin binomial sera Bi (7, 0.25).

    Para calcular la probabilidad de que sobrevivan los 7 pacientes utilizamos la funcin de

    densidad o cuanta ya que determina la probabilidad de que el nmero de

    supervivientes sea igual a un determinado valor x. La probabilidad de que X fuera

    exactamente igual a 7.

    Para hallar esta probabilidad se puede aplicar la frmula de la funcin de densidad o

    cuanta en la distribucin binomial, se puede encontrar en las tablas de esta

    distribucin o mediante el programa STATA. Los tres mtodos deben dar el mismo

    resultado:

    Miramos en la tabla de la distribucin binomial teniendo en cuenta que n=7 y

    p=0.25.

    Escribimos di binomialp(7,7,0.25) en el apartado de comandos de STATA.

    El resultado es 0.0001 (puede que no sea exactamente igual porque en las tablas se

    redondea). Es una probabilidad muy baja.

    Probabilidad de que sobrevivan solamente?

  • 19

    - Miramos en la tabla teniendo en cuenta que n=7 , x=5 y p=0.25 Resultado: 0.0015.

    - Escribimos di binomialp(7,5,0.25) en el apartado de comandos de STATA. Resultado:

    0.0015

    Cul sera el nmero esperado de supervivientes cuando hacemos las 7

    operaciones?

    Hay que hallar la esperanza matemtica o la media de una binomial multiplicando el

    nmero de operaciones por la probabilidad:

    nxp=7x0.25=1.75, esperamos que sobrevivan 1 o 2 pacientes como mucho.

    Cul sera la varianza de x? nxpxq=1.31

    Y la desviacin estndar? 1.31= 1.14

    Tambin podemos utilizar STATA para hallarlo:

    - Calcular la esperanza: di7*0.25

    - Calculamos varianza: divarianza7*0.25*0.75

    Cul sera la esperanza matemtica de la variable x si realizamos 100 pruebas?

    Cuando tratamos con un nmero grande de pruebas (en general mayor que 30), la media (nxp)

    es mayor que 5 y nx(1-p) tambin es mayor que 5 , podemos aproximar la distribucin

    binomial a la normal. No obstante, tambin se puede resolver siguiendo el procedimiento

    utilizado en los ejercicios anteriores.

    La distribucin normal depende de 2 parametros: la media y la desviacin estndar. La media

    se halla multiplicando nxp y la desviacin estndar se obtiene haciendo (nxpxq).

    Cuando n=100, x puede tomar valores desde el 0 hasta el 100. Cada uno de esos valores tiene

    una probabilidad.

    La imagen muestra un diagrama de barras y en l observamos que cada valor tiene su

    probabilidad. En este caso, la distribucin binomial est centrada en 50 porque esa es la

    media.

    Sin embargo, nuestra distribucin binomial estara centrada en 25 y la desviacin estndar

    sera de 4,33.

  • 20

    Ahora utilizaremos la distribucin normal para calcular las siguientes probabilidades:

    Probabilidad de que sobrevivan 10 o menos:

    di binomial (100,10,0.25)=0.00013

    X Bi(100,0.25) N (25,4.33)

    F(10)= P[X10]=P[N(25,4.33)10.5]

    Estandarizamos:

    F(10)=P [((x-25)/4.33) ((10.5-25)/4.33)]

    P=0.00040606

    Probabilidad de observar solo 10

    P[X=10]=P[9.5 X 10.5]= P[((9.5-25)/4.33) ((X-25)/4.33) ((10.5-25)/4.33)]

    Utilizando STATA, tendramos que poner en la barra de comandos:

    dinormal((10.5-25/4.33)-normal((9.5-25)/4.33)

    Resultado= 0.000239

    Probabilidad de que sobrevivan 5

    n=7, x=5, p=0.0115

    dis binomial(7,5,0.25)

    Resultado=0.01153

    Cul ser el nmero de superivientes?

    =nxp=7x0.25=1.25

    Utilizando STATA:

    di 7*0.25=

    Cul sera la varianza?

    divarianza7*0.25*0.25

    Resultado=1.3125

    NOTA*: Las ltimas diapositivas del Power Point no se vieron en clase.