31

Distribuciones de Probabilidades

Embed Size (px)

DESCRIPTION

Las diferentes distribuciones

Citation preview

A) DISTRIBUCIONES DISCRETAS

• Las distribuciones discretas incluidas en el módulo de “Cálculo de probabilidades” son:

• Uniforme discreta

• Binomial

• Hipergeométrica

• Geométrica

• Binomial Negativa

• Poisson

DISTRIBUCIÓN UNIFORME DISCRETA (A, B)• Es una distribución muy sencilla que asigna

probabilidades iguales a un conjunto finito de puntos del espacio. 

• Asigna igual probabilidad a todos los valores enteros entre el límite inferior y el límite superior que definen el recorrido de la variable. Si la variable puede tomar valores entre a y b, debe ocurrir que b sea mayor que a, y la variable toma los valores enteros empezando por a, a+1, a+2, etc. hasta el valor máximo b.

• Un ejemplo puede ser la variable X, puntuación en el lanzamiento de un dado regular. Esta variable toma seis valores posibles, todos con la misma probabilidad p = 1/6. La función de densidad de esta variable será:

f(k) = P[X = k] = 1/6             k = 1, 2, 3, 4, 5, 6

• En general, si la variable X puede tomar n (k = 1, 2, 3,..., n) valores, todos con igual probabilidad, su función de densidad será:

• Por su elementalidad  no es una distribución de excesivo interés práctico.

f(k) = P[X = k] = 1/n   ,    k = 1, 2, ..., n

Media y Varianza:

EJEMPLO:• El temario de un examen para un proceso

selectivo contiene 50 temas, de los cuales se elegirá uno por sorteo. Si una persona no ha estudiado los 15 últimos temas ¿Cuál es la probabilidad de que apruebe el examen?

• La variable que representa el número del tema seleccionado para el examen sigue una distribución uniforme con parámetros a=1 y b=50. La persona aprueba el examen si le toca un tema del 1 al 35; por tanto, la probabilidad que se pide es la cola a la izquierda de 35. Para obtener los resultados basta con proporcionarle los parámetros de la distribución, y seleccionar calcular probabilidades para el punto 35.

RESULTADOSCálculo de probabilidades. Distribuciones discretas

Uniforme Discreta (a, b)

a : Mínimo 1

b : Máximo 50

Punto K 35

Cola Izquierda Pr [X<=k] 0,0200

Probabilidad Pr [X=k] 0,7000

Cola Derecha Pr [X>k] 0,3000

Media 25,5000

Varianza 208,2500

La persona tiene una probabilidad de aprobar igual a 0,7

DISTRIBUCIÓN

BINOMIAL (N, P)• Es una distribución discreta muy importante que surge en

muchas aplicaciones bioestadísticas.

• La distribución binomial está asociada a experimentos del siguiente tipo:

• Realizamos n veces cierto experimento en el que consideramos sólo la posibilidad de éxito o fracaso.

• La obtención de éxito o fracaso en cada ocasión es independiente de la obtención de éxito o fracaso en las demás ocasiones.

• La probabilidad de obtener éxito o fracaso siempre es la misma en cada ocasión.

• Esta distribución aparece de forma natural al realizar repeticiones independientes de un experimento que tenga respuesta binaria, generalmente clasificada como “éxito” o “fracaso”.

Si realizamos n veces un experimento en el que podemos obtener éxito, E, con probabilidad p y fracaso, F, con probabilidad q (q = 1 − p), diremos que estamos ante una distribución binomial de parámetros n y p, y lo representaremos por Bin(n,p).En este caso la probabilidad de obtener k éxitos viene dada por:

Media:

Varianza:

Valores:

x: 0, 1, 2, ..., n : nº de éxitos en la prueba

Parámetros:

n: número de pruebas, n > 0 entero

p: probabilidad de éxito, 0 < p < 1

EJERCICIO:• En un examen formado por 20 preguntas, cada una

de las cuales se responde declarando “verdadero” o “falso”, el alumno sabe que, históricamente, en el 75% de los casos la respuesta correcta es “verdadero” y decide responder al examen tirando dos monedas, pone “falso” si ambas monedas muestran una cara y “verdadero” si al menos hay una cruz. Se desea saber qué probabilidad hay de que tenga al menos 14 aciertos.

• Hay que proporcionarle los parámetros de la distribución y el punto k a partir del cual se calculará la probabilidad. En este caso n=20, p=0,75 y el punto k=14.

RESULTADOS

Cálculo de probabilidades. Distribuciones discretas

Binomial (n, p)

n: Número de pruebas 20

p: Probabilidad de éxito 0,7500

Punto K 14

 

Probabilidad Pr [X=k] 0,1686

Cola Izquierda Pr [X<=k] 0,3828

Cola Derecha Pr [X>k] 0,6172

Media 15,0000

Varianza 3,7500

La probabilidad de que el alumno tenga más de 14 aciertos se sitúa en 0,61.

DISTRIBUCIÓN HIPERGEOMÉTRICA (N, R, N)

• La distribución hipergeométrica suele aparecer en procesos muestrales sin reemplazo, en los que se investiga la presencia o ausencia de cierta característica.

• Los experimentos que tienen este tipo de distribución tienen las siguientes características:

a) Al realizar un experimento con este tipo de distribución, se esperan dos tipos de resultados.

b) Las probabilidades asociadas a cada uno de los resultados no son constantes.

c) Cada ensayo o repetición del experimento no es independiente de los demás.

d) El número de repeticiones del experimento (n) es constante.

• Por tanto, esta distribución es la equivalente a la binomial, pero el muestreo se hace sin reemplazo.

EJERCICIO• En una urna o recipiente hay un total

de N objetos, entre los cuales hay una cantidad a de objetos que son defectuosos, si se seleccionan de esta urna n objetos al azar, y sin reemplazo, ¿cuál es la probabilidad de obtener x objetos defectuosos?

• Aplicando al fórmula:

• Donde:• p(x,n) = probabilidad de obtener x

objetos defectuosos de entre n seleccionados.

• Muestras de n objetos en donde hay x que son defectuosos y n-x buenos

• Todas las muestras posibles de seleccionar de n objetos tomadas de entre N objetos en total = espacio muestral.

Considerando que en la urna hay un total de 10 objetos, 3 de los cuales son defectuosos, si de seleccionan 4 objetos al azar, ¿cuál es la probabilidad de que 2 sean defectuosos?

SOLUCIÓN:

N = 10 objetos en total

a = 3 objetos defectuosos

n = 4 objetos seleccionados en muestra

x = 2 objetos defectuosos deseados en la muestra

Luego la probabilidad de obtener 2 objetos defectuosos entre los 4 seleccionados al azar sería:

DISTRIBUCIÓN GEOMÉTRICA (P)

Supóngase, que se efectúa repetidamente un experimento o prueba, que las repeticiones son independientes y que se está interesado en la ocurrencia o no de un suceso al que se refiere como “éxito”, siendo la probabilidad de este suceso p.La distribución geométrica permite calcular la probabilidad de que tenga que realizarse un número k de repeticiones hasta obtener un éxito por primera vez.

La distribución geométrica se utiliza en la distribución de tiempos de espera, de manera que si los ensayos se realizan a intervalos regulares de tiempo, esta variable aleatoria proporciona el tiempo transcurrido hasta el primer éxito.

Valores: X: 0, 1, 2, ...

Parámetros: p: probabilidad de éxito, 0<p<1

DISTRIBUCIÓN BINOMIAL NEGATIVA (R, P)

Una generalización obvia de la distribución geométrica aparece si se supone que un experimento se continúa hasta que un determinado suceso, de probabilidad p, ocurre por r-ésima vez. La variable aleatoria que proporciona la probabilidad de que se produzcan k fracasos antes de obtener el r-ésimo éxito sigue una distribución binomial negativa de parámetros r y p, BN(r, p).

La distribución geométrica corresponde al caso particular en que r=1.

Un ejemplo es el número de lanzamientos fallidos de un dado antes de obtener un 6 en tres ocasiones, que sigue una BN(3,1/6).

En el caso de que los sucesos ocurran a intervalos regulares de tiempo, esta variable proporciona el tiempo total para que ocurran r éxitos, por lo que también se denomina“distribución binomial de tiempo de espera”.

Valores: X: 0, 1, 2, ...Parámetros: p: probabilidad de éxito, 0 < p < 1 r: número de éxitos, r > 0

DISTRIBUCIÓN POISSON (LAMBDA)

En general, la distribución de Poisson se puede utilizar como una aproximación de la binomial, Bin(n, p), si el número de pruebas n es grande, pero la probabilidad de éxito p es pequeña; una regla es que la aproximación Poisson-binomial es “buena” si n=20 y p<=0,05 y “muy buena” si n=100 y p<=0,01.

El parámetro de la distribución, lambda, representa el número promedio de eventos esperados por unidad de tiempo o de espacio, por lo que también se suele hablar de lambda como “la tasa de ocurrencia” del fenómeno que se observa.

La distribución de Poisson tiene iguales la media y la varianza. Si la variación de los casos observados en una población excede a la variación esperada por la Poisson, se está ante la presencia de un problema conocido como sobre dispersión y, en tal caso, la distribución binomial negativa es más adecuada.

Valores: X: 0, 1, 2, ...Parámetros: λ: media de la distribución, λ > 0

En estadística la distribución beta es una distribución de probabilidad continua con dos parámetros  y  cuya función de densidad es:

El valor esperado

La varianza

DISTRIBUCIÓN BETA

DISTRIBUCIÓN BETA• Es muy utilizada como distribución a priori cuando

las observaciones tienen una distribución binomial.

• Uno de los principales recursos de esta distribución es el ajuste a una gran variedad de distribuciones empíricas, pues adopta formas muy diversas dependiendo de cuáles sean los valores de los parámetros de forma p y q, mediante los que viene definida la distribución.

DISTRIBUCION POISSON

• Describe las llegadas por unidad de tiempo.

• la distribución de Poisson es discreta

DISTRIBUCION EXPONENCIAL

• la distribución exponencial estudia el tiempo entre cada una de estas llegadas.

• la distribución exponencial es continua porque el tiempo entre llegadas no tiene que ser un número entero.

DISTRIBUCIÓN EXPONENCIAL

CARACTERÍSTICAS

• Ejemplos: El tiempo que un medico dedica a una exploración, el tiempo de servir una medicina en una farmacia, o el tiempo de atender a una urgencia.

El uso de la distribución exponencial supone que los tiempos de servicio son aleatorios, es decir, que un tiempo de servicio determinado no depende de otro servicio realizado anteriormente ni de la posible cola que pueda estar formándose.

No tienen "edad" o en otras palabras, "memoria".

LA FUNCIÓN DE DENSIDAD

*FUNCION DE DISTRIBUCION

EJEMPLO

• El tiempo durante el cual cierta marca de batería trabaja en forma efectiva hasta que falle (tiempo de falla) se distribuye según el modelo exponencial con un tiempo promedio de fallas igual a 360 días.

a) ¿Qué probabilidad hay que el tiempo de falla sea mayor que 400 días?

b) Si una de estas baterías ha trabajado ya 400 días, ¿qué probabilidad hay que trabaja más de 200 días más?

DISTRIBUCION JI-CUADRADA (X2)

• En realidad la distribución ji-cuadrada es la distribución muestral de s2. O sea que si se extraen todas las muestras posibles de una población normal y a cada muestra se le calcula su varianza, se obtendrá la distribución muestral de varianzas.

• Es una distribución ji-cuadrada con gl=n-1 grados de libertad y se denota X2 (X es la minúscula de la letra griega ji). El estadístico ji-cuadrada esta dado por: *N: Tamaño de la

muestra

* s2 varianza muestral

* varianza de la población

DISTRIBUCIÓN T DE STUDENT

• La distribución t se usa de manera extensa en problemas que tienen que ver con inferencia acerca de la media de la población o en problemas que implican muestras comparativas

FORMULAS: