Todo Sobre Distribuciones Leer Para Le Parcial

Embed Size (px)

Citation preview

DISTRIBUCIONES DE PROBABILIDAD

NDICE DISTRIBUCIONES DE PROBABILIDAD........................................................ 3 CLCULO DE PROBABILIDADES.................................................................................... 3 Conceptos generales............................................................................................................3 DISTRIBUCIONES DISCRETAS......................................................................................... 4 Distribucin Uniforme discreta (a,b).................................................................................. 4 Distribucin Binomial (n,p)................................................................................................ 5 Distribucin Hipergeomtrica (N,R,n)................................................................................6 Distribucin Geomtrica (p)............................................................................................... 7 Distribucin Binomial negativa (r,p).................................................................................. 8 Distribucin Poisson (lambda)..........................................................................................10 DISTRIBUCIONES CONTINUAS......................................................................................12 Distribucin Uniforme (a,b)..............................................................................................12 Distribucin Normal (Mu, Sigma).................................................................................... 14 Distribucin Lognormal (Mu, Sigma).............................................................................. 16 Distribucin Logstica (a, b)............................................................................................. 17 Distribucin Beta (p,q)......................................................................................................18 Distribucin Gamma (a,p).................................................................................................19 Distribucin Exponencial (lambda).................................................................................. 21 Distribucin Ji-cuadrado (n)............................................................................................. 22 Distribucin t de Student (n).............................................................................................23 Distribucin F de Snedecor (n,m)..................................................................................... 24 GENERACIN DE DISTRIBUCIONES............................................................................ 26 Conceptos generales..........................................................................................................26 DISTRIBUCIONES DISCRETAS....................................................................................... 26 Distribucin Multinomial..................................................................................................27 DISTRIBUCIONES CONTINUAS......................................................................................27 Distribucin Normal bivariante........................................................................................ 28 BIBLIOGRAFA.................................................................................................................. 29

DISTRIBUCIONES DE PROBABILIDADCLCULO DE PROBABILIDADES Conceptos generalesUno de los objetivos de la estadstica es el conocimiento cuantitativo de una determinada parcela de la realidad. Para ello, es necesario construir un modelo de esta realidad particular objeto de estudio, partiendo de la premisa de que lo real es siempre ms complejo y multiforme que cualquier modelo que se pueda construir. De todas formas, la formulacin de modelos aceptados por las instituciones responsables y por los usuarios, permite obviar la existencia del error o distancia entre la realidad y el modelo. Los modelos tericos a los que se hace referencia se reducen en muchos casos a (o incluyen en su formulacin) funciones de probabilidad. La teora de la probabilidad tiene su origen en el estudio de los juegos de azar, que impulsaron los primeros estudios sobre clculo de probabilidades en el siglo XVI, aunque no es hasta el siglo XVIII cuando se aborda la probabilidad desde una perspectiva matemtica con la demostracin de la ley dbil de los grandes nmeros segn la cual, al aumentar el nmero de pruebas, la frecuencia de un suceso tiende a aproximarse a un nmero fijo denominado probabilidad. Este enfoque, denominado enfoque frecuentista, se modela matemticamente en el siglo XX cuando Kolmogorov formula la teora axiomtica de la probabilidad1. Dicha teora define la probabilidad como una funcin que asigna a cada posible resultado de un experimento aleatorio un valor no negativo, de forma que se cumpla la propiedad aditiva. La definicin axiomtica establece las reglas que deben cumplir las probabilidades, aunque no asigna valores concretos. Uno de los conceptos ms importantes de la teora de probabilidades es el de variable aleatoria que, intuitivamente, puede definirse como cualquier caracterstica medible que toma diferentes valores con probabilidades determinadas. Toda variable aleatoria posee una distribucin de probabilidad que describe su comportamiento (vale decir, que desagrega el 1 a lo largo de los valores posibles de la variable). Si la variable es discreta, es decir, si toma valores aislados dentro de un intervalo, su distribucin de probabilidad especifica todos los valores posibles de la variable junto con la probabilidad de que cada uno ocurra. En el caso continuo, es decir, cuando la variable puede tomar cualquier valor de un intervalo, la distribucin de probabilidad permite determinar las probabilidades correspondientes a con subintervalos de valores. Una forma usual de describir la distribucin de probabilidad de una variable aleatoria es mediante la denominada funcin de densidad, en tanto que lo que se conoce como funcin de distribucin representa las probabilidades acumuladas2-7. Una de las preocupaciones de los cientficos ha sido construir modelos de distribuciones de probabilidad que pudieran representar el comportamiento terico de diferentes fenmenos aleatorios que aparecan en el mundo real. La pretensin de modelar lo observable ha constituido siempre una necesidad bsica para el cientfico emprico, dado que a travs de esas construcciones tericas, los modelos, poda experimentar sobre aquello que la realidad no le permita. Por otra parte, un modelo resulta extremadamente til, siempre que se corresponda con la realidad que pretende representar o predecir, de manera que ponga de relieve las propiedades ms importantes del mundo que nos rodea, aunque sea a costa de la simplificacin que implica todo modelo.

3

En la prctica hay unas cuantas leyes de probabilidad tericas, como son, por ejemplo, la ley binomial o la de Poisson para variables discretas o la ley normal para variables continuas, que sirven de modelo para representar las distribuciones empricas ms frecuentes. As, por ejemplo, la variable talla de un recin nacido puede tener valores entre 47 cm y 53 cm, pero no todos los valores tienen la misma probabilidad, porque las ms frecuentes son las tallas prximas a los 50 cm. En este caso la ley normal se adapta satisfactoriamente a la distribucin de probabilidad emprica, que se obtendra con una muestra grande de casos. Epidat 3.1 ofrece, en este mdulo, procedimientos usuales para calcular probabilidades y sus inversas, para un conjunto bastante amplio de funciones de distribucin, discretas y continuas, que son habituales en el proceso de modelacin. Por ejemplo, el conjunto de distribuciones pertenecientes a la familia exponencial es de uso frecuente en metodologas como el anlisis de supervivencia o el Modelo Lineal Generalizado. Otras distribuciones son comunes y habituales en el campo de actuacin de disciplinas tales como la economa, la biologa, etc. Cuando la opcin elegida es el clculo de una probabilidad dado un punto x de la distribucin, se presentan en todos los casos dos resultados: la probabilidad acumulada hasta ese punto, o la probabilidad de que la variable tome valores inferiores o iguales a x (cola izquierda) y la probabilidad de valores superiores a x (cola derecha). En el caso continuo, la probabilidad de que la variable sea igual a cualquier punto es igual a cero; por tanto, no influye en las colas el hecho de incluir o excluir el punto x. Hay un tercer resultado que el programa presenta slo para las distribuciones continuas simtricas (normal, logstica y t de Student): la probabilidad de dos colas, es decir, la probabilidad que queda a ambos lados del intervalo (-x, x) (x, -x), segn el punto sea positivo o negativo, respectivamente. Asimismo, los resultados de Epidat 3.1 incluyen la media y la varianza de la correspondiente distribucin, as como la mediana y/o la moda en el caso de las distribuciones continuas. Epidat 3.1 tambin ofrece la posibilidad de representar, grficamente, las funciones de distribucin y densidad.

DISTRIBUCIONES DISCRETASLas distribuciones discretas incluidas en el mdulo de Clculo de probabilidades son: Uniforme discreta Binomial Hipergeomtrica Geomtrica Binomial Negativa Poisson

Distribucin Uniforme discreta (a,b)Describe el comportamiento de una variable discreta que puede tomar n valores distintos con la misma probabilidad cada uno de ellos. Un caso particular de esta distribucin, que es la que se incluye en este mdulo de Epidat 3.1, ocurre cuando los valores son enteros consecutivos. Esta distribucin asigna igual probabilidad a todos los valores enteros entre el lmite inferior y el lmite superior que definen el recorrido de la variable. Si la variable puede tomar valores entre a y b, debe ocurrir que b sea mayor que a, y la variable toma los valores enteros empezando por a, a+1, a+2, etc. hasta el valor mximo b. Por ejemplo, cuando se observa el nmero obtenido tras el lanzamiento de un dado perfecto, los valores posibles

4

siguen una distribucin uniforme discreta en {1, 2, 3, 4, 5, 6}, y la probabilidad de cada cara es 1/6. Valores: x: a, a+1, a+2, ..., b, nmeros enteros Parmetros: a: mnimo, a entero b: mximo, b entero con a < b Ejercicio El temario de un examen para un proceso selectivo contiene 50 temas, de los cuales se elegir uno por sorteo. Si una persona no ha estudiado los 15 ltimos temas Cul es la probabilidad de que apruebe el examen? La variable que representa el nmero del tema seleccionado para el examen sigue una distribucin uniforme con parmetros a=1 y b=50. La persona aprueba el examen si le toca un tema del 1 al 35; por tanto, la probabilidad que se pide es la cola a la izquierda de 35. Para obtener los resultados en Epidat 3.1 basta con proporcionarle los parmetros de la distribucin, y seleccionar calcular probabilidades para el punto 35. Resultados con Epidat 3.1Clculo de probabilidades. Distribuciones discretas Uniforme discreta (a,b) a : Mnimo b : Mximo Punto K Probabilidad Pr[X=k] Cola Izquierda Pr[Xk] Media Varianza 1 50 35 0,0200 0,7000 0,3000 25,5000 208,2500

La persona tiene una probabilidad de aprobar igual a 0,7.

Distribucin Binomial (n,p)La distribucin binomial es una distribucin discreta muy importante que surge en muchas aplicaciones bioestadsticas. Esta distribucin aparece de forma natural al realizar repeticiones independientes de un experimento que tenga respuesta binaria, generalmente clasificada como xito o fracaso. Por ejemplo, esa respuesta puede ser el hbito de fumar (s/no), si un paciente hospitalizado desarrolla o no una infeccin, o si un artculo de un lote es o no defectuoso. La variable discreta que cuenta el nmero de xitos en n pruebas independientes de ese experimento, cada una de ellas con la misma probabilidad de xito igual a p, sigue una distribucin binomial de parmetros n y p. Este modelo se aplica a poblaciones finitas de las que se toma elementos al azar con reemplazo, y tambin a poblaciones conceptualmente infinitas, como por ejemplo las piezas que produce una mquina, siempre que el proceso de produccin sea estable (la proporcin de piezas defectuosas se mantiene constante a largo plazo) y sin memoria (el resultado de cada pieza no depende de las anteriores).

5

Un ejemplo de variable binomial puede ser el nmero de pacientes ingresados en una unidad hospitalaria que desarrollan una infeccin nosocomial. Un caso particular se tiene cuando n=1, que da lugar a la distribucin de Bernoulli. Valores: x: 0, 1, 2, ..., n Parmetros: n: nmero de pruebas, n > 0 entero p: probabilidad de xito, 0 < p < 1 Ejercicio En un examen formado por 20 preguntas, cada una de las cuales se responde declarando verdadero o falso, el alumno sabe que, histricamente, en el 75% de los casos la respuesta correcta es verdadero y decide responder al examen tirando dos monedas, pone falso si ambas monedas muestran una cara y verdadero si al menos hay una cruz. Se desea saber qu probabilidad hay de que tenga al menos 14 aciertos. Hay que proporcionarle a Epidat 3.1 los parmetros de la distribucin y el punto k a partir del cual se calcular la probabilidad. En este caso n=20, p=0,75 y el punto k=14. Resultados con Epidat 3.1 Clculo de probabilidades. Distribuciones discretasBinomial (n,p) n: Nmero de pruebas p: Probabilidad de xito Punto K Probabilidad Pr[X=k] Cola Izquierda Pr[Xk] Media Varianza 20 0,7500 14 0,1686 0,3828 0,6172 15,0000 3,7500

La probabilidad de que el alumno tenga ms de 14 aciertos se sita en 0,61.

Distribucin Hipergeomtrica (N,R,n)La distribucin hipergeomtrica suele aparecer en procesos muestrales sin reemplazo, en los que se investiga la presencia o ausencia de cierta caracterstica. Pinsese, por ejemplo, en un procedimiento de control de calidad en una empresa farmacutica, durante el cual se extraen muestras de las cpsulas fabricadas y se someten a anlisis para determinar su composicin. Durante las pruebas, las cpsulas son destruidas y no pueden ser devueltas al lote del que provienen. En esta situacin, la variable que cuenta el nmero de cpsulas que no cumplen los criterios de calidad establecidos sigue una distribucin hipergeomtrica. Por tanto, esta distribucin es la equivalente a la binomial, pero cuando el muestreo se hace sin reemplazo. Esta distribucin se puede ilustrar del modo siguiente: se tiene una poblacin finita con N elementos, de los cuales R tienen una determinada caracterstica que se llama xito

6

(diabetes, obesidad, hbito de fumar, etc.). El nmero de xitos en una muestra aleatoria de tamao n, extrada sin reemplazo de la poblacin, es una variable aleatoria con distribucin hipergeomtrica de parmetros N, R y n. Cuando el tamao de la poblacin es grande, los muestreos con y sin reemplazo son equivalentes, por lo que la distribucin hipergeomtrica se aproxima en tal caso a la binomial. Valores: x: max{0,n-(N-R)}, ..., min{R,n}, donde max{0,n-(N-R)} indica el valor mximo entre 0 y n(N-R) y min{R,n} indica el valor mnimo entre R y n. Parmetros: N: tamao de la poblacin, N>0 entero R: nmero de xitos en la poblacin, R0 entero n: nmero de pruebas, n>0 entero Ejercicio Se sabe que el 7% de los tiles quirrgicos en un lote de 100 no cumplen ciertas especificaciones de calidad. Tomada una muestra al azar de 10 unidades sin reemplazo, interesa conocer la probabilidad de que no ms de dos sean defectuosos. El nmero de tiles defectuosos en el lote es R=0,07100=7. Para un tamao muestral de n=10, la probabilidad buscada es P{nmero de defectuosos 2}. Resultados con Epidat 3.1Clculo de probabilidades. Distribuciones discretas Hipergeomtrica (N,R,n) N : Tamao de la poblacin R : Nmero xitos en la pob. n : Nmero de pruebas Punto K Probabilidad Pr[X=k] Cola Izquierda Pr[Xk] Media Varianza 100 7 10 2 0,1235 0,9792 0,0208 0,7000 0,5918

La probabilidad de que a lo sumo haya dos tiles defectuosos en el lote es aproximadamente 0,98.

Distribucin Geomtrica (p)Supngase, que se efecta repetidamente un experimento o prueba, que las repeticiones son independientes y que se est interesado en la ocurrencia o no de un suceso al que se refiere como xito, siendo la probabilidad de este suceso p. La distribucin geomtrica permite calcular la probabilidad de que tenga que realizarse un nmero k de repeticiones hasta obtener un xito por primera vez. As pues, se diferencia de la distribucin binomial en que el nmero de repeticiones no est predeterminado, sino que es la variable aleatoria que se mide y, por otra parte, el conjunto de valores posibles de la variable es ilimitado.

7

Para ilustrar el empleo de esta distribucin, se supone que cierto medicamento opera exitosamente ante la enfermedad para la cual fue concebido en el 80% de los casos a los que se aplica; la variable aleatoria intentos fallidos en la aplicacin del medicamento antes del primer xito sigue una distribucin geomtrica de parmetro p=0,8. Otro ejemplo de variable geomtrica es el nmero de hijos hasta el nacimiento de la primera nia. La distribucin geomtrica se utiliza en la distribucin de tiempos de espera, de manera que si los ensayos se realizan a intervalos regulares de tiempo, esta variable aleatoria proporciona el tiempo transcurrido hasta el primer xito. Esta distribucin presenta la denominada propiedad de Harkov o de falta de memoria, que implica que la probabilidad de tener que esperar un tiempo t no depende del tiempo que ya haya transcurrido. Valores: x: 0, 1, 2, ... Parmetros: p: probabilidad de xito, 0