30
UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD 6.- VARIABLE ALEATORIA VARIABLE ALEATORIA DISCRETA 6.1. INTRODUCCIÓN A la Estadística no le interesan los resultados individuales, su objetivo es el comportamiento en masa o de las poblaciones. Esto significa que hay que visualizar la realización de un número muy grande de experimentos aleatorios (o de muestras aleatorias) y sus posibles resultados asociados, para informarse acerca de los parámetros o las explicaciones referidas a la población de interés. En esta sección seguiremos avanzando para sentar las bases de la modelización de resultados sujetos al azar que permitirán, a través de la inferencia estadística, enunciar ideas generales acerca de las poblaciones. El concepto de experimento aleatorio, se utiliza para describir cualquier proceso mediante el cual se generan observaciones cuyos resultados no se pueden predecir. La acción imaginaria de arrojar dos monedas y observar el resultado ( ε 1 ) , así como la de sembrar tres semillas en una maceta y observar lo que sucede con la su germinación ( ε 2 ) o, medir la nota de aprobación de Estadística obtenida por un alumno ( ε 3 ) , o de medir los rendimientos de un proceso de elaboración de pulpa en kg / hora ( ε 4 ) , constituyen ejemplos de un experimento aleatorio. En los dos primeros casos, los espacios muestrales asociados estarán conformados por resultados cualitativos ε 1 →S 1 ={( S,S) ; ( C,S ) ; ( S,C) ; ( C,C ) } ε 2 →S 2 ={( N,N,N ) ; ( G,N,N) ; ( N,G,N) ; ( N,N,G ) ; ( G,G,N ) ; ( G,N,G) ; ( N,G,G ) ; ( G,G,G ) } Por tanto, estos espacios muestrales son de naturaleza cualitativa, en ellos para el primer caso S denota “sello” y C denota “cara”, y para el segundo G denota “germinada” y N denota “no germinada”. En los otros dos experimentos el espacio muestral asociado es de naturaleza numérica, por ejemplo se puede indicar lo siguiente ε 3 →S 3 = { x x ∈N∧ 6 ≤x≤ 10 } ε 4 →S 4 = { x x ∈R∧x≥ 0 } 105 Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014 Contenidos 6.1. Introducción 6.2.Variable aleatoria discreta 6.2.1. Función de Probabilidad para una VAD 6.2.2. Función de Distribución de Probabilidades Acumuladas de una VAD 6.4.Valor esperado o Esperanza 6.5.Varianza de una variable aleatoria TEMA

Variable Aleatoria Discreta y Distribuciones Discretas de Probabilidad (Tema 6)

Embed Size (px)

DESCRIPTION

A la Estadística no le interesan los resultados individuales, su objetivo es el comportamiento en masa o de las poblaciones. Esto significa que hay que visualizar la realización de un número muy grande de experimentos aleatorios (o de muestras aleatorias) y sus posibles resultados asociados, para informarse acerca de los parámetros o las explicaciones referidas a la población de interés. En esta sección seguiremos avanzando para sentar las bases de la modelización de resultados sujetos al azar que permitirán, a través de la inferencia estadística, enunciar ideas generales acerca de las poblaciones.El concepto de experimento aleatorio, se utiliza para describir cualquier proceso mediante el cual se generan observaciones cuyos resultados no se pueden predecir. La acción imaginaria de arrojar dos monedas y observar el resultado (ε_1 ), así como la de sembrar tres semillas en una maceta y observar lo que sucede con la su germinación (ε_2 ) o, medir la nota de aprobación de Estadística obtenida por un alumno (ε_3 ), o de medir los rendimientos de un proceso de elaboración de pulpa en kg / hora (ε_4 ), constituyen ejemplos de un experimento aleatorio. En los dos primeros casos, los espacios muestrales asociados estarán conformados por resultados cualitativos

Citation preview

Page 1: Variable Aleatoria Discreta y Distribuciones Discretas de Probabilidad (Tema 6)

UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD

6.- VARIABLE ALEATORIAVARIABLE ALEATORIA DISCRETA

6.1. INTRODUCCIÓN

A la Estadística no le interesan los resultados individuales, su objetivo es el comportamiento en masa o de las poblaciones. Esto significa que hay que visualizar la realización de un número muy grande de experimentos aleatorios (o de muestras aleatorias) y sus posibles resultados asociados, para informarse acerca de los parámetros o las explicaciones referidas a la población de interés. En esta sección seguiremos avanzando para sentar las bases de la modelización de resultados sujetos al azar que permitirán, a través de la inferencia estadística, enunciar ideas generales acerca de las poblaciones.

El concepto de experimento aleatorio, se utiliza para describir cualquier proceso mediante el cual se generan observaciones cuyos resultados no se pueden predecir. La acción imaginaria de arrojar dos monedas y observar el resultado ( ε1 ), así como la de sembrar tres semillas en una maceta y observar lo

que sucede con la su germinación ( ε2 ) o, medir la nota de aprobación de Estadística obtenida por un

alumno ( ε3 ), o de medir los rendimientos de un proceso de elaboración de pulpa en kg / hora ( ε4 ), constituyen ejemplos de un experimento aleatorio. En los dos primeros casos, los espacios muestrales asociados estarán conformados por resultados cualitativos

ε 1→ S1={( S , S ) ; (C , S ); ( S ,C ); (C ,C ) }ε 2→ S2={( N , N , N ); (G ,N , N ) ; ( N , G, N ) ; ( N , N , G ) ; (G ,G , N ); (G , N ,G ); ( N , G ,G ) ; (G ,G , G ) }

Por tanto, estos espacios muestrales son de naturaleza cualitativa, en ellos para el primer caso S denota “sello” y C denota “cara”, y para el segundo G denota “germinada” y N denota “no germinada”. En los otros dos experimentos el espacio muestral asociado es de naturaleza numérica, por ejemplo se puede indicar lo siguiente

ε 3→ S3={xx∈N∧6 ≤ x ≤ 10}

ε 4 → S4={xx∈ R∧ x≥ 0}

Sin embargo, habría que notar que en los experimentos vinculados a espacios de naturaleza cualitativa, estamos interesados más bien en el número de veces que se presenta cierto resultado de interés esto es, por ejemplo 0,1 ó 2 caras o bien 0, 1, 2 ó 3 semillas germinadas, es decir que interesan resultados numéricos.

S1= {0,1,2 } S2= {0,1,2,3 }

Una primera interpretación que se le puede dar al concepto de variable aleatoria es la siguiente: es una variable que toma valores numéricos de acuerdo con los resultados de un experimento, y más formalmente se dice que

Una variable aleatoria es una función que a cada elemento del espacio muestral le hace corresponder un número real.

La variable puede tomar diferentes valores numéricos y además estos valores dependen de los resultados experimentales que se producen por azar, por tanto ellos también presentan aleatoriedad. Para la notación simbólica adoptaremos X mayúscula para denotar la función variable aleatoria, S para

105Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014

Contenidos6.1. Introducción6.2.Variable aleatoria discreta

6.2.1. Función de Probabilidad para una VAD6.2.2. Función de Distribución de Probabilidades Acumuladas de una VAD

6.4.Valor esperado o Esperanza6.5.Varianza de una variable aleatoria

66 TEMA

Page 2: Variable Aleatoria Discreta y Distribuciones Discretas de Probabilidad (Tema 6)

UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD

representar el conjunto espacio muestral y para representar el conjunto de los reales. Por lo tanto, s es un elemento de S y x, minúscula, es un elemento de .

Esquemáticamente, podemos ilustrar a una VA cualquiera como:

Se observa que la VA es una función que:a) se aplica a un conjunto de partida, que es el espacio muestral (dominio) conformado por los

resultados de un experimento aleatorio (eventos de naturaleza cualitativa o cuantitativa), y b) genera un conjunto equivalente o conjunto de llegada (codominio) conformado por eventos xi

que, como se dijo, pertenecen a , conjunto de los números reales (eventos de naturaleza cuantitativa).

En el experimento arrojar una moneda, el espacio muestral está constituido por sólo dos resultados posibles (variable dicotómica), cara (C) y sello (S); en tal caso la VA podría consistir en una regla que refleje algún criterio de conveniencia: se asigna el valor 1 a cara, porque se apostó a cara (se ganará) y se asigna 0 a sello porque con este resultado gana el contrario (se perderá).

Supongamos ahora el experimento de lanzar dos dados y registrar el puntaje total obtenido. El espacio muestral se presenta en la siguiente tabla de doble entrada.

Tabla 6.1. Conjunto de los pares ordenados (si,sj) que pertenecen al espacio muestral SSegunda tirada

1 2 3 4 5 6

Primera tirada

1 (1,1) (1,2) (1,3) (1,4) (1,5) (1,6)

2 (2,1) (2,2) (2,3) (2,4) (2,5) (2,6)

3 (3,1) (3,2) (3,3) (3,4) (3,5) (3,6)

4 (4,1) (4,2) (4,3) (4,4) (4,5) (4,6)

5 (5,1) (5,2) (5,3) (5,4) (5,5) (5,6)

6 (6,1) (6,2) (6,3) (6,4) (6,5) (6,6)

Podríamos interesarnos en la ocurrencia de un evento A definido como "la suma de los puntos es igual a 9". En el espacio muestral del experimento (Tabla 6.1 y Gráfico 6.1) puede verse que hay cuatro puntos muestrales que cumplen con esa condición: s63, s54, s45 y s36, referidos respectivamente a los pares ordenados (6,3), (5,4), (4,5) y (3,6). Significa que el evento A, es un evento compuesto formado por cuatro eventos simples. Si ahora consideramos el espacio de valores de la variable aleatoria X:”puntaje total obtenido” (Gráfico 6.2) vemos que el evento “la variable aleatoria toma el valor

nueve” (X=xi, xi =9) está formado por la colección de cuatro valores 9 asociados con los anteriores puntos muestrales. Es por tal razón que se suele utilizar la notación conjuntista {x=9}, a los efectos de denotar que se tiene una colección de eventos simples y a cada uno de ellos les corresponde el valor de variable aleatoria 9.

0 1 2 3 4 5 6

0

1

2

3

4

5

6

(1;1)

(1;2)

(1;3)

(1;4)

(1;5)

(1;6)

(2;1)

(2;2)

(2;3)

(2;4)

(2;5)

(2;6)

(3;1)

(3;2)

(3;3)

(3;4)

(3;5)

(3:6)

(4;1)

(4;2)

(4;3)

(4;4)

(4;5)

(4;6)

(5;1)

(5;2)

(5;3)

(5;4)

(5;5)

(5;6)

(6;1)

(6;2)

(6;3)

(6;4)

(6;5)

(6;6)

Gráfico 6.1 Espacio muestral para el lanzamiento de un par de dados legales

resultados del 1° dado

resu

ltados

del 2°

dado

0 1 2 3 4 5 6

0

1

2

3

4

5

6

x=2

x=3

x=4

x=5

x=6

x=7

x=3

x=4

x=5

x=6

x=7

x=8

x=4

x=5

x=6

x=7

x=8

x=9

x=5

x=6

x=7

x=8

x=9

x=10

x=6

x=7

x=8

x=9

x=10

x=11

x=7

x=8

x=9

x=10

x=11

x=12

Gráfico 6.2 Espacio de valores para la variable aleatoria "total de puntos al lanzar dos dados"

resultados del 1° dado

resu

ltados

del 2°

dado

Una situación análoga se presenta si consideramos el experimento de seleccionar un alumno del

listado del curso de Estadística del ciclo 2000, interesando la variable nota promedio entre la 106

Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014

X (s) xs

S

Page 3: Variable Aleatoria Discreta y Distribuciones Discretas de Probabilidad (Tema 6)

| | | | |

-2 -1 0 1 2 Rx 210 ,,XR

s2s1 s3s4

UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD

clasificación del primer y segundo parcial. El alumno en el primer parcial pudo tener una nota que varía entre 0 y 10, y el segundo lo mismo (Gráfico 6.3). También en este caso, cada valor de la variable aleatoria está asociado con una colección de puntos muestrales, por ejemplo, el promedio siete podría surgir de (7,7); (8,6); (9,5); (10,4); (6,8); (5,9) o (4,10).

Gráfico 6.3. Valor (7) que toma la variable aleatoria asociado a los eventos simples del espacio muestral S.

A partir de estos ejemplos, es importante remarcar lo siguiente:1º) Existe una relación funcional entre los eventos simples del S y los valores de X.2º) Cada evento simple en el espacio muestral se corresponde con uno y sólo un valor de la variable aleatoria. 3º) Es posible que a varios eventos simples en el espacio muestral del experimento, les corresponda el mismo valor numérico de variable aleatoria.

Finalmente, lo más importante de la variable aleatoria radica en lo siguiente: se dijo que el principal objetivo de la estadística es el estudio de los fenómenos de masa, y no de casos aislados. En otras palabras, debemos recordar que nuestro objetivo es llegar a conocer la población a partir de la cual se extrajeron las muestras en estudio. La VA permitirá describir, mediante modelos de probabilidad, a todos los posibles resultados de un experimento aleatorio, tal como una distribución de frecuencias permitió describir la distribución de todos los datos de una muestra.

Estamos ya en condiciones de introducir una definición formal de VA.

Definición 6.1Sea un experimento aleatorio y el espacio muestral S, asociado con el experimento. Se llama variable aleatoria a la función X que se define sobre S, X(s), y aplicada a cada uno de los elementos pertenecientes al S, les asigna un número real.En símbolos

X:S→S→ X(s)

Al espacio constituido por el conjunto de todos los posibles valores de la variable aleatoria X, se lo suele llamar recorrido de la VA y se lo simboliza como RX. En cierto sentido podemos considerar a este recorrido como otro espacio muestral, como ya se había visto esquemáticamente. Insistimos: mientras los puntos muestrales del espacio S son los resultados experimentales que pueden ser observables o eventos simples si (de naturaleza numérica o no), el nuevo espacio muestral (creado artificialmente) está asociado con los valores de la variable aleatoria X que siempre son numéricos. Diremos entonces que los eventos definidos en uno y otro espacio, son eventos equivalentes. Luego la teoría de probabilidad aplicada a eventos definidos en el espacio muestral, puede ser aplicada al cálculo de las probabilidades de ocurrencia de valores de variables aleatorias.

S

X ( si )

107Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014

0 1 2 3 4 5 6 7 8 9 10 X0 1 2 3 4 5 6 7 8 9 10 X0 1 2 3 4 5 6 7 8 9 10 X0 1 2 3 4 5 6 7 8 9 10 X0 1 2 3 4 5 6 7 8 9 10 X0 1 2 3 4 5 6 7 8 9 10 X0 1 2 3 4 5 6 7 8 9 10 X0 1 2 3 4 5 6 7 8 9 10 X0 1 2 3 4 5 6 7 8 9 10 X0 1 2 3 4 5 6 7 8 9 10 X0 1 2 3 4 5 6 7 8 9 10 X0 1 2 3 4 5 6 7 8 9 10 X0 1 2 3 4 5 6 7 8 9 10 X0 1 2 3 4 5 6 7 8 9 10 X0 1 2 3 4 5 6 7 8 9 10 X0 1 2 3 4 5 6 7 8 9 10 X0 1 2 3 4 5 6 7 8 9 10 X0 1 2 3 4 5 6 7 8 9 10 X0 1 2 3 4 5 6 7 8 9 10 X0 1 2 3 4 5 6 7 8 9 10 X0 1 2 3 4 5 6 7 8 9 10 X0 1 2 3 4 5 6 7 8 9 10 X0 1 2 3 4 5 6 7 8 9 10 X0 1 2 3 4 5 6 7 8 9 10 X0 1 2 3 4 5 6 7 8 9 10 X0 1 2 3 4 5 6 7 8 9 10 X0 1 2 3 4 5 6 7 8 9 10 X0 1 2 3 4 5 6 7 8 9 10 X0 1 2 3 4 5 6 7 8 9 10 X

Page 4: Variable Aleatoria Discreta y Distribuciones Discretas de Probabilidad (Tema 6)

UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD

Una vez definida una variable aleatoria X y su recorrido RX, se pueden inducir probabilidades sobre eventos asociados con RX, a partir de las que están especificadas para los eventos equivalentes del espacio muestral S.

6.2. VARIABLE ALEATORIA DISCRETA

Se vio al clasificar los espacios muestrales que:a) Si un espacio muestral contiene un número finito de posibilidades o una serie interminable con

tantos elementos como números enteros existen, se llama espacio muestral discreto.b) Si un espacio muestral contiene un número infinito de posibilidades igual al número de puntos

en un segmento de línea, se llama espacio muestral continua.

En correspondencia, las VA se clasifican en dos tipos: las variables aleatorias discretas y las continuas.

Definición 6.2.Sea un experimento E y un espacio muestral S asociado al mismo, la variable aleatoria X es discreta si el espacio S es discreto. Es decir, que X tomará valores contables (ya sea finito o infinito) que podrán arreglarse en una secuencia que corresponde a los números enteros positivos.

Algunas variables aleatorias discretas típicas son el número de unidades defectuosas en una industria conservera, el número de insectos encontrados en un brote, el número de frutos producidos por una planta, el número de hectáreas de una finca, etc. Al contrario, el tiempo de espera para ser atendido en un supermercado, la cantidad de litros embotellados diariamente por una bodega, la temperatura media diaria, el tiempo empleado para hacer una determinación analítica, el pH, son algunos ejemplos de variables aleatorias continuas.

A continuación se ilustra el concepto a través del experimento lanzar dos monedas y considerar que la variable aleatoria de interés es X: “número de caras obtenidas”.

Los eventos simples que conforman el espacio muestral de este experimento son cuatro.

A1 = {(C,C)}, A2 ={(C,S)}, A 3 ={(S,C)} y, A4 = {(C,C)}, es decir

S1= {A1 , A2 , A3 , A4 }={(S , S ); (C , S ); ( S , C ); (C , C ) }

La variable aleatoria X dada sólo toma tres posibles valores, digamos x1, x2 y x3 donde x1 =0, x2=1 y x3=2, es decir:

RX={0,1,2 }

Este resultado se deriva de aplicar la definición de variable aleatoria.

A continuación se muestra la correspondiente interpretación gráfica:

S R X

Para este ejemplo, si las monedas son equilibradas, se tendrá que P(C,S)=P(S,C)=P(CS)= P(SC)= ½.½=1/4. Por lo tanto, el evento compuesto “aparece sólo una cara” tiene una probabilidad de ½, obtenida según :

P(una cara) = P{(C,S) U (S,C)}= (1/4) + (1/4) = 1/2.

108Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014

1

2

X(S,C)

X(S,S) 0

(S,S)

(S,C)

(C,S)

(C,C)

X(C,S)

X(C,C)

Page 5: Variable Aleatoria Discreta y Distribuciones Discretas de Probabilidad (Tema 6)

UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD

Si la variable aleatoria X toma valor x=1, equivalente al evento A={(C,S) U (S,C)} , podemos calcular la probabilidad del evento dado como:

P(X=1) = P{(C,S) U (S,C)}= ½.

Gráficamente, esto es:

P (xi ) es una función, la función probabilidad: a cada valor x i de la VAD le hace corresponder un número real entero entre cero y uno,

P(A1) = P(C,C) = ½ . ½ = ¼ = P (X = 2) P (A2 U A 3)= P (C,S)U(S,C) = ¼ + ¼ = ½ = P (X = 1)

P(A 4)= P (S,S) = ½ . ½ = ¼ = P(X = 0)

Hemos definido a una VA discreta y los resultados de la variable con sus respectivas probabilidades. Con este soporte teórico podremos calcular las probabilidades de que se produzcan determinados valores de una variable aleatoria, mediante las denominadas funciones de probabilidad.

6.2.1. Función de Probabilidad para una VAD

Una vez especificados con claridad un experimento y sus resultados, se puede calcular la probabilidad de la ocurrencia de cualquier valor de una variable aleatoria de interés. Por ejemplo, supóngase que se tienen 140 alumnos de Estadística divididos en cuatro grupos. El tamaño del grupo ha sido fijado de acuerdo a la capacidad que tienen las aulas disponibles y es el siguiente:

Tabla 6.2 Cantidad de alumnos que cursan Estadística divididos en gruposGrupo 1 2 3 4Cantidad de alumnos 25 45 40 30

Podemos determinar la probabilidad que se tiene de que al seleccionar al azar un alumno provenga de un grupo en particular. Es decir, nos interesa determinar la probabilidad que corresponda a cada uno de los posibles valores de la variable aleatoria X, que para este ejemplo son 1, 2, 3 y4.A continuación, en tabla 6.3, se presenta la serie de valores de la variable X y sus correspondientes probabilidades, obtenidas aplicando el enfoque empirista, lo que constituye la distribución de probabilidades de X.

Tabla 6.3. Distribución de probabilidades para X en el ejemplo de la asignación de los grupos

Resultado Valor de x p(x)

Grupo 1 125140

=0 ,179

Grupo 2 245140

=0 ,321

Grupo 3 340140

=0 ,286

Grupo 4 430140

=0 ,214

Suma 1Se observa:

1) p ( x )≥02) Sólo cuatro posibles valores (x =1, 2, 3

ó 4), por lo tanto entre ellos se distribuye la probabilidad total unitaria (todos el resto de los valores en la recta numérica real, tienen probabilidad igual a cero)

109Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014

0 1 2 3 40

0.1

0.2

0.3

0.4

Gráfico 6.4: distribución discreta de probabili-dades por grupo

x

P(x)

1

1/2

0

P(x i)

1

R X

(S,S)

(C,S)

(S,C)

(C,C)

S

P(X=xi)=P(X=1)=P(1 )=1/2

X(A)

xi = 1

Page 6: Variable Aleatoria Discreta y Distribuciones Discretas de Probabilidad (Tema 6)

UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD

Cuando se tiene una distribución de probabilidades para una variable aleatoria X, podemos hablar del modelo de probabilidades que describe el comportamiento de esa variable en la población objetivo de estudio. Entonces, estaremos interesados en condensar esa información en algunas medidas descriptivas, fundamentalmente la media de una distribución de probabilidades y su varianza, denominadas esperanza matemática y varianza de una variable aleatoria, respectivamente.

Seguidamente se muestra un diagrama que resume los conceptos vertidos acerca de cómo se llega a un modelo poblacional probabilístico.

Especificar elExperimento

E

Reconocertodos los

resultados

Espacio muestral

S

Asignar un número

Cada uno de losresultados

Variable aleatoria X

Determinar la

probabilidadp(xi)

p(x)

X

Distribución de probabilidades

Gráfico 6.5. El modelo probabilístico

En esta sección se considerará el concepto de distribución de probabilidad de una variable aleatoria. En general, una variable aleatoria discreta X representa los resultados de un espacio muestral en forma tal que por P(X =x) se entenderá la probabilidad de que X tome el valor de x. De esta forma, al considerar los valores de una variable aleatoria es posible desarrollar una función matemática que asigne una probabilidad a cada valor x de la variable aleatoria X. Esta función recibe el nombre de función de probabilidad de la variable aleatoria X. El término más general, distribución de probabilidades, se refiere a la colección de valores de la variable aleatoria y a la distribución de probabilidades entre éstos.

Definición 6.3Sea X una variable aleatoria discreta. Se llamará a p(x) = P (X = x) función de probabilidad de la variable aleatoria X, si satisface las siguientes propiedades:

1. p(x) 0 para ∀ x i∈ℜx

2. ip(xi) = 1

Las distribuciones de probabilidades pueden presentarse en forma tabular y gráfica, como se muestra en el siguiente ejemplo:

Tabla 6.4: Correspondencia entre los resultados del lanzamiento de un par de dados y la variable aleatoria que representa la suma de las caras

ResultadoValor de la

Variable aleatoriaNº de casosfavorables

Probabilidad

(1,1) 2 1 1/36(1,2), (2,1) 3 2 2/36(1,3), (2,2), (3,1) 4 3 3/36(1,4), (2,3), (3,2), (4,1) 5 4 4/36(1,5), (2,4), (3,3), (4,2), (5,1) 6 5 5/36(1,6), (2,5), (3,4), (4,3), (5,2), (6,1) 7 6 6/36(2,6), (3,5), (4,4), (5,3), (6,2) 8 5 5/36(3,6), (4,5), (5,4), (6,3) 9 4 4/36(4,6), (5,5), (6,4) 10 3 3/36(5,6), (6,5) 11 2 2/36(6,6) 12 1 1/36

Total ------ 36 1,00

110Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014

0 1 2 3 4 5 6 7 8 9 10 11 12

0

0.04

0.08

0.12

0.16

0.2

Gráfico 6.6. Distribución de probabilidades para la suma de puntos al lanzar un par de dados

x

p(x)

Page 7: Variable Aleatoria Discreta y Distribuciones Discretas de Probabilidad (Tema 6)

UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD

A esta altura resulta conveniente analizar comparativamente el alcance de dos conceptos: frecuencia relativa y función probabilidad. Técnicamente, la diferencia consiste en que las frecuencias son frecuencias instantáneas acotadas a los resultados de una muestra, mientras que los valores de una función de probabilidad pueden interpretarse como frecuencias relativas teóricas a largo plazo para todas las repeticiones concebibles de un experimento aleatorio. De este modo, las probabilidades se relacionan con la población. En la práctica, indican el porcentaje de veces respecto a un gran número de observaciones en que se espera que se presenten los diferentes valores de una variable aleatoria.

Nótese que, dada una distribución de probabilidad, es fácilmente evidente que algunos resultados de una variable aleatoria sean más probables que otros. Además, la probabilidad de un determinado resultado, o grupo de resultados, se puede determinar sin mucho esfuerzo. En términos prácticos, por lo general no es necesario molestarse en calcular cada una de las probabilidades para obtener una distribución probabilística. Para ello se dispone de tablas y fórmulas. En consecuencia, el problema real no es “¿cómo se derivan los valores?”, sino ¿”cómo se utilizan las distribuciones para resolver problemas?”

6.2.2. Función de Distribución de Probabilidades Acumuladas de una VAD

Ahora, además del hecho de que las distribuciones probabilísticas proporcionan un método sencillo para la determinación de ciertas probabilidades, los tipos de distribución se pueden considerar como modelos que describen situaciones que comprenden resultados generados aleatoriamente.Sin embargo, hacer referencia a la distribución de probabilidades de X no sólo implica la existencia de la función de probabilidad, sino también la existencia de la función de distribución de probabilidades acumuladas de X.

Definición 6.4.Sea X una VAD, la función de distribución acumulada de probabilidades F(x) de la variable aleatoria discreta X está dada por:

F(x) = P(Xx) = ∑i=1

k

p (xi)

i =1,…,k

Por lo tanto, en el caso discreto, una variable aleatoria X está caracterizada por la función de probabilidad puntual p(x), la cual determina la probabilidad puntual de que X = x, y por la función de distribución acumulada F(x), la que representa la suma de las probabilidades puntuales hasta el valor x de X, inclusive. Nótese que las definiciones anteriores son consistentes con los axiomas de probabilidad, ya que esta función no es negativa para cualquier valor de la variable aleatoria y la suma de las probabilidades para todos los valores de X es igual a uno.

Ejemplo 6.1. Considérese de nuevo el lanzamiento de dos dados. Si X es la variable aleatoria que representa la suma de las caras, la función de probabilidad de X es

p( x )=¿ {6−|7−x|36

¿ ¿¿¿ (1)

Con (1), pueden determinarse las probabilidades para varios valores de X contenidos en la tabla 6.4 y cuya gráfica se muestra en el gráfico 6.7. Además, puede evaluarse la función de distribución acumulada de X de la siguiente forma:

F(1)= P (X 1) = 0F(2)= P (X 2) = 1/36F(3)= P (X 3) = 3/36F(4)= P (X 4) = 6/36F(5)= P (X 5) = 10/36F(6)= P (X 6) = 15/36

F(7)= P (X 7) = 21/36F(8)= P (X 8) = 26/36F(9)= P (X 9) = 30/36F(10)= P (X 10)= 33/36F(11)= P (X 11) = 35/36F(12)= P (X 12) = 1

Nótese queP (X 7) = 1 – F(7) = 15/36 P (X =7) = P (X 7) - P (X 6) = 6/36P (4 X 9) = P (X 9) - P (X 3) = F(9) - F(3) = 27/36

En general, la función de distribución acumulada F(x) de una variable aleatoria discreta es una función no decreciente (o monótona creciente) de los valores de X, de tal manera que cumple con las siguientes propiedades:

1. 0 ≤ F ( x )≤ 1 para cualquier x2. F ( x i ) ≥ F ( x j ) si x i>x j

3. P ( X >x )=1−F ( x )

111Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014

Page 8: Variable Aleatoria Discreta y Distribuciones Discretas de Probabilidad (Tema 6)

UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD

Además, puede establecerse que para variables aleatorias de valor entero:4. P ( X =xi )=F ( x i )−F ( x i−1 )5. P ( x i≤ X ≤ x j )=F ( x j )−F ( xi−1 )

La gráfica de la distribución acumulada del ejemplo 6.1 se muestra en el gráfico 6.7. En este gráfico es evidente que la función de distribución acumulativa de una variable aleatoria discreta es una función escalón, que toma un valor superior en cada salto.

1/36

3/36

6/36

10/36

15/36

21/36

26/36

30/36

33/36

35/36

36/36

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Gráfico 6.7. Representación gráfica de la función de distribución acumulativa de la suma de las caras de dos dados

x

F(x)

InterpretaciónSe desprende que el concepto de frecuencia relativa acumulada y su representación gráfica, ya vistos, tienen también su contrapartida en el estudio de las probabilidades. Una función acumulada describe cómo se acumulan las probabilidades del mismo modo exactamente que la cuarta columna de la tabla de distribución de frecuencias describe la manera en que se acumulan las frecuencias relativas: sumando todos los valores de estas frecuencias. El valor de la función acumulada es cualquier punto dado xi, F(X = xi) representa la suma de todos los valores de la función de probabilidad correspondientes a todos los valores de la variable aleatorias x que son menores o iguales a xi.

Ejemplo 6.2. Supóngase que se lanza una moneda dos veces de tal forma que el espacio muestra es S = {(C,C), (C,S), (S,C), (S,S)}. Represéntese por X el número de caras que pueden resultar. Con cada punto muestral podemos asociar un número para X como se muestra en la Tabla 6.5. Así en el caso de (C,C) (es decir 2 caras), x = 2 en tanto que para (S,C) (1 cara), x= 1. Se concluye que X es una variable aleatoria.

Tabla 6.5: Correspondencia de los eventos simples de S del ejemplo 6.2 y los valores que toma la VAD XPunto muestral CC CS SC SS

X 2 1 1 0

Debe observarse que también podrían definirse otras muchas variables aleatorias en este

espacio muestral, por ejemplo X1:”el cuadrado del número de caras”, X2: “el número de caras menos el número de sellos”, etc.

Retomando el ejemplo 6.2:

a) Hallar la función de probabilidad correspondiente a la variable aleatoria X.b) Construir la gráfica de la Función de probabilidad.

Solución

(a) Suponiendo que la moneda es legal tenemos

P {(CC ) }= 14

P {(CS ) }= 14

P {( SC ) }= 14

P {(SS ) }= 14

Luego P ( X=0 )=P {( SS ) }= 14

112Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014

Page 9: Variable Aleatoria Discreta y Distribuciones Discretas de Probabilidad (Tema 6)

UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD

P ( X=1 )=P {(CS )∪ (SC ) }=P {(CS ) }+P {(SC ) }= 14

+ 14

= 24

P ( X=2 )=P {(CC ) }= 14

Así, la función de probabilidad está dada en la Tabla 6.5.

Tabla 6.5.: Función de probabilidad para el ejemplo 6.2xi 0 1 2

p(xi) 1/4 2/4 1/4

(b) La gráfica de la función de probabilidad puede representarse como se indica en la Gráfico 6.8

0 1 2

0

1/4

2/4

3/4

Gráfico 6.8. Función de probabilidad del númerod de caras al lanzar dos veces un moneda legal

x

p(x)

Ejemplo 6.3. Sea la función de distribución para la variable aleatoria X

F ( x ){0 −∞ <x<01/4 0≤x<12/ 4 1≤ x<21 2≤x<∞

Los aspectos siguientes acerca de la función de distribución anterior, que son verdaderos en general, deben notarse:

1. Las magnitudes de los saltos para p(x), en 0, 1, 2 son 1/4, 1/2, 1/4 que corresponden exactamente a las ordenadas en la figura. Este hecho permite obtener la función de probabilidad a partir de la función de distribución.

2. Debido a la apariencia de la gráfica 6.6 frecuentemente se la llama función escalera o función escalonada o función paso.

VALOR ESPERADO Y VARIANZA DE UNA VADEl valor esperado de una variable aleatoria X, simbolizado como E [ X ], es el promedio o valor medio de X y está dado por:

E [ X ]=μ=∑i=1

k

x i p ( x i )i=1,2,…, k

Varianza de X:

V [ X ]=σ 2=E [ ( X −μ )2 ]=∑i=1

k

x i p ( x i )

113Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014

0

1/4

2/4

1

-3 -2 -1 0 1 2 3 4

Gráfico 6.9- Función de distribución de probabi-lidades para el ejemplo 6.3

x

F(x)

Page 10: Variable Aleatoria Discreta y Distribuciones Discretas de Probabilidad (Tema 6)

UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD

DISTRIBUCIONES DISCRETAS DE PROBABILIDAD

6.3 INTRODUCCIÓN

Se ha visto que las variables aleatorias se relacionan con los experimentos aleatorios, y que en todos los casos se trata de variables numéricas. En este capítulo se desarrollarán modelos probabilísticos o modelos estocásticos, que describen el comportamiento de variables aleatorias discretas y en el próximo se introducirán modelos para el caso continuo. En ambos casos se trata de un tipo de modelo formal que puede expresarse mediante una fórmula, y que es muy utilizado en el ámbito de las ciencias aplicadas para explicar el comportamiento de los fenómenos aleatorios.

Un modelo probabilístico para el caso discreto, expresa la relación entre los valores de una variable aleatoria discreta y la probabilidad asociada a posibles valores de la misma. en cuyo caso tal regla de correspondencia se denomina función de probabilidad. La información correspondiente se suele organizar como una distribución de probabilidad, la cual se refiere a la distribución de las probabilidades asociadas a cada uno de los valores de la variable aleatoria. Las distribuciones probabilísticas se pueden representar a través de una tabla o de una representación gráfica.

Entre los modelos de distribuciones de probabilidad de variables discretas se tiene a los siguientes:

Modelo uniforme (discreto). Modela la distribución de probabilidades de una variable donde todos sus posibles valores tienen la misma probabilidad de ocurrencia.

Modelo Bernoulli 1. Modela la distribución de probabilidades para variables dicotómicas con recorrido RX = {0,1}.

Modelo binomial. Modela la distribución de probabilidades de una variable que se refiere a la cantidad de éxitos que se pueden lograr al realizar una cierta cantidad de experimentos simples con probabilidad de éxito constante y con repeticiones independientes.

Modelo multinomial. Este modelo puede considerarse una generalización de la distribución binomial, o sea aplicable al cálculo de la probabilidad de obtener n1, n2, ..., nk ocurrencias en k categorías (mutuamente excluyentes) de una muestra de tamaño nc=n1+n2+...+ nk.

Modelo geométrico. Modela la distribución de probabilidades de una variable que se refiere a realizar cierto número de experimentos antes de obtener un éxito.

Modelo Poisson 2. Modela la distribución de la probabilidad de que ocurra un evento raro en un periodo de tiempo o cierto espacio.

1 Jakob Bernoulli o Jacob Bernoulli (1654 - 1705), fue un matemático y científico suizo cuya obra maestra fue Ars Conjectandi (el Arte de la conjetura), un trabajo pionero en la teoría de la probabilidad. Los términos ensayo de Bernoulli y números de Bernoulli son resultado de su trabajo, publicado siete años después de su muerte.

2 Modelo descubierto por Siméon-Denis Poisson (1781- 1840), un físico y matemático francés que se interesó en el cálculo de las integrales y en la distribución de las cargas eléctricas sobre la superficie de los conductores. En 1837 publicó Recherches sur la probabilité des jugements en matières criminelles et matière civile (Investigación sobre la probabilidad de los juicios en materias criminales y civiles), donde describió la probabilidad de acontecimientos fortuito ocurridos en un tiempo o intervalo de espacio, cuando la probabilidad de ocurrencia es muy pequeña, pero el número de intentos es muy grande.

114Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014

Contenidos6.3 Introducción6.4 Distribución uniforme6.5 Distribución Bernoulli6.6 Distribución binomial

6.6.1.Función de probabilidad, media y varianza de la distribución binomial

6.6.2.Gráfico de la función de probabilidad6.6.3. Gráfico de la función de distribución acumulada6.6.4.Aplicaciones de la distribución binomial

6.7 Distirbución de Poisson 6.7.1. Parámetros de la distribución de Poisson

6.7.2. Media y varianza de la distribución de Poisson6.7.3. Determinación de la probabilidad

Page 11: Variable Aleatoria Discreta y Distribuciones Discretas de Probabilidad (Tema 6)

UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD

En este curso se utilizarán los modelos uniforme y de Bernoulli para introducir algunos conceptos básicos, pero el interés se centrará en los modelos binomial y de Poisson.

6.4 DISTRIBUCIÓN UNIFORME

Se conoce que en el experimento de arrojar al aire un dado legal, todos los puntajes del 1 al 6, tienen la misma probabilidad de aparecer, y que esta es igual a 1/6.

Se puede decir entonces que la distribución uniforme se caracteriza porque todos los valores de un sistema finito de valores posibles son igualmente probables.

Propiedades

Parámetros del modelo k

Esperanza matemática o media

E [ X ]=μ= k+12

Varianza V [ X ]=σ 2= k2−112

Desviación estándar σ =√V [ X ]

Ejemplo 7.1: la variable aleatoria X asociada al experimento de tirar un dado sigue una distribución uniforme discreta, cuya media es 3,5 y varianza 5,8.

Gráfico 7.1. Distribución de probabilidades de X u (x;k= 6)

La expresión X u (x;k= 6) se lee: “variable aleatoria X cuyos valores x siguen una distribución de probabilidades uniforme discreta con parámetro k=6”.

6.5 DISTRIBUCIÓN BERNOULLI

Se conoce que los resultados en el experimento de arrojar al aire una moneda legal, corresponden a los de una variable dicotómica: ocurre cara (C) u ocurre sello (S). Además siendo legal, la probabilidad de ocurrencia del evento que generalmente se considera éxito es igual a ½, un valor que se mantendrá constante cada vez que se haga este tipo de experimento.

En la teoría de probabilidad se considera como ensayo de Bernoulli a un experimento aleatorio que se realiza una sola vez, donde se trata de observar si cierto suceso ocurre o no ocurre. Significa que el espacio muestral sólo tiene dos resultados, que suelen denominarse como evento éxito y evento fracaso, esto es S = {E, F}. Desde el punto de vista de la teoría de la probabilidad, tales ensayos están modelados por una variable aleatoria dicotómica que puede tomar sólo dos valores, 0 y 1, que suelen aplicarse respectivamente para etiquetar los eventos fracaso y éxito, o sea que x=0 si el suceso no ocurre (se observó el evento fracaso) y x=1 en el caso que ocurra (se observó el evento éxito).

115Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014

Definición 7.1. Distribución uniforme discreta

Sea una variable aleatoria X, en la que cada uno de sus valores x1,x2,…., tiene igual probabilidad de ocurrencia. Luego, se dice que X es una variable aleatoria que se distribuye uniformemente sobre n puntos cuya función de probabilidad es

P ( X=x )=p ( x )=u ( x ;k )={1k

siendo k un núemroentero y x=x1 , x2 , …,xk

0encualquier otrocaso

p(x)

1/6

1 2 3 4 5 6 X

p(x)

1/6

1 2 3 4 5 6 X

p(x)

1/6

1 2 3 4 5 6 X

p(x)

1/6

1 2 3 4 5 6 X

p(x)

1/6

1 2 3 4 5 6 X

p(x)

1/6

1 2 3 4 5 6 X

p(x)

1/6

1 2 3 4 5 6 X

p(x)

1/6

1 2 3 4 5 6 X

p(x)

1/6

1 2 3 4 5 6 X

p(x)

1/6

1 2 3 4 5 6 X

p(x)

1/6

1 2 3 4 5 6 X

p(x)

1/6

1 2 3 4 5 6 X

p(x)

1/6

1 2 3 4 5 6 X

p(x)

1/6

1 2 3 4 5 6 X

p(x)

1/6

1 2 3 4 5 6 X

p(x)

1/6

1 2 3 4 5 6 X

p(x)

1/6

1 2 3 4 5 6 X

p(x)

1/6

1 2 3 4 5 6 X

p(x)

1/6

1 2 3 4 5 6 X

p(x)

1/6

1 2 3 4 5 6 X

p(x)

1/6

1 2 3 4 5 6 X

p(x)

1/6

1 2 3 4 5 6 X

p(x)

1/6

1 2 3 4 5 6 X

p(x)

1/6

1 2 3 4 5 6 X

p(x)

1/6

1 2 3 4 5 6 X

p(x)

1/6

1 2 3 4 5 6 X

p(x)

1/6

1 2 3 4 5 6 X

p(x)

1/6

1 2 3 4 5 6 X

p(x)

1/6

1 2 3 4 5 6 X

Page 12: Variable Aleatoria Discreta y Distribuciones Discretas de Probabilidad (Tema 6)

UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD

Definición 7.2 Distribución Bernoulli

Sea una variable aleatoria X, asociada a la presencia de obtener un éxito cuando se realiza un único experimento con dos posibles resultados (éxito o fracaso). Luego, se dice que X es una variable aleatoria que se distribuye uniformemente sobre n puntos cuya función de probabilidad es

P ( X=x )=p ( x )=b ( x ; π )={ π si x=11−π si x=0

0 encualquier otro caso

Propiedades

Parámetros del modelo π

Esperanza matemática o media

E [ X ]=μ=π

Varianza V [ X ]=σ 2=π (1−π )

Desviación estándar σ =√V [ X ]

Ejemplo 7.2. la variable aleatoria X asociada al experimento de tirar una moneda una vez sigue una distribución Bernoulli, si cara es el evento éxito y sello el evento fracaso, la probabilidad de éxito es p=0,5 y la probabilidad de fracaso es q = 1-p = 0,5. La media es 0,5 y la varianza 0,25.

Gráfico 7.2. Distribución de probabilidades de X b (x; 0,5)

La expresión X b (x; 0,5) se lee: “variable aleatoria X cuyos valores por siguen una distribución de probabilidades Bernoulli con parámetro = 0,5”.

En forma análoga, el experimento de lanzar un dado legal y considerar como evento éxito la salida del 6, se asocia con una variable dicotómica, esto es S = {6, no 6}. La variable aleatoria X se referirá a la ocurrencia del 6, que se etiquetará con 1 (éxito) en tanto que 0 representará que salga cualquier puntaje que no sea 6 (fracaso). La probabilidad clásica indica que = 1 / 6, de este modo

P(6) = P(X = 1) = p (1) = 1 / 6 ≈ 0,17

P(no 6) = P(X = 0) = p (0) = 1- p (0) ≈ 0,83

6.6 DISTRIBUCIÓN BINOMIAL

6.6.1 Generalidades.

Se considerará una encuesta de mercado, realizada para predecir las preferencias sobre determinados productos alimenticios, la entrevista de un solo consumidor se parece, en muchos aspectos, al lanzamiento de una sola moneda, porque el consumidor puede indicar que un producto le parece bueno o bien caratularlo con una opinión diferente (regular, malo o desconocido). Otra situación parecida se daría en el caso de un sociólogo rural que se interesa por la fracción de casas rurales que tienen electricidad donde cada casa podría resultar que está electrificada o no; o de un docente que se interesa por la fracción del número de alumnos que aprueba el curso cuando existe la posibilidad de que un alumno apruebe o bien no apruebe.

En cada uno de los ejemplos dados, hay dos resultados posibles: el resultado de interés, que se llamará éxito y el resultado adverso que se considerará un fracaso. Si el estudio se hubiera realizado consultando a un solo consumidor, o a una solo familia rural o a un solo alumno, el modelo probabilístico que se utilizaría para describir la correspondiente variable aleatoria habría sido el de Bernoulli. Pero, en estos tres casos, siempre se recurrirá al estudio de una muestra de tamaño n, de modo que se estará aplicando un ensayo de tipo Bernoulli n veces. Se trata entonces de un proceso repetitivo de ensayos

116Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014

p(x)

0,5

0 1 X

p(x)

0,5

0 1 X

p(x)

0,5

0 1 X

p(x)

0,5

0 1 X

p(x)

0,5

0 1 X

p(x)

0,5

0 1 X

p(x)

0,5

0 1 X

p(x)

0,5

0 1 X

p(x)

0,5

0 1 X

p(x)

0,5

0 1 X

p(x)

0,5

0 1 X

p(x)

0,5

0 1 X

p(x)

0,5

0 1 X

p(x)

0,5

0 1 X

p(x)

0,5

0 1 X

p(x)

0,5

0 1 X

p(x)

0,5

0 1 X

p(x)

0,5

0 1 X

p(x)

0,5

0 1 X

p(x)

0,5

0 1 X

p(x)

0,5

0 1 X

p(x)

0,5

0 1 X

p(x)

0,5

0 1 X

p(x)

0,5

0 1 X

p(x)

0,5

0 1 X

p(x)

0,5

0 1 X

p(x)

0,5

0 1 X

p(x)

0,5

0 1 X

p(x)

0,5

0 1 X

Page 13: Variable Aleatoria Discreta y Distribuciones Discretas de Probabilidad (Tema 6)

UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD

Bernoulli, que se llama proceso de Bernoulli.

Si en el ejemplo mencionado anteriormente sobre una encuesta de mercado, se entrevista a diez (c=10) consumidores, y dado que: a) cada consumidor podrá estar a favor (éxito) ó no (fracaso) de un producto en particular, b) debido a que se trabaja con una muestra seleccionada al azar, cada ensayo es

independiente de otro y, c) π , la probabilidad de éxito permanece constante en cada ensayo (π = 0,5). Puede decirse entonces que se está frente a un proceso Bernoulli en el que se repite 10 veces un ensayo Bernoulli (c=10). El objetivo es llegar a modelar el comportamiento de X, es decir, la VAD (variable aleatoria discreta) que representa el número de consumidores que están a favor del producto (Rx = {0,1, 2, 3, 4, 5, 6, 7, 8, 9, 10}).

Cuando se cumple todas las características definidas para un proceso Bernoulli, se dice que se trata de un tipo de experimento denominado experimento Binomial.

Ejemplo 7.3: De un proceso de producción que supondremos arroja un 25% de artículos defectuosos, se seleccionan tres artículos al azar que se inspeccionan y se clasifican como defectuosos ó no defectuosos. En el contexto de la inspección de calidad de los procesos productivos se suele designar como éxito al resultado: artículo defectuoso. El número de éxitos es una variable aleatoria X que toma valores enteros de 0 a 3. ¿Es éste un experimento binomial?

1. El experimento consiste en c=3 ensayos o pruebas de Bernoulli que se repiten.2. Cada ensayo es independiente de los otros (que un artículo sea defectuoso o no defectuoso

no influye en el resultado que arroja otro artículo).3. Cada ensayo arroja un resultado que se puede clasificar como éxito o fracaso. (cada artículo

podrá ser defectuoso o no defectuoso).4. La probabilidad de éxito permanecerá constante en cada prueba. (siempre que se seleccione

un artículo, éste tendrá una probabilidad de 0,25 de ser defectuoso).5. La variable aleatoria X representa el número de artículos defectuosos en todo el

experimento. (Rx = {0, 1, 2, 3}).Por lo tanto, después del análisis de los ítems anteriores, se concluye que se trata de un experimento binomial. Los ocho resultados posibles del experimento anterior (2x2x2) y los valores de la variable aleatoria X se reflejan en la siguiente tabla:

6.6.2 Propiedades características de la distribución binomial

El número de éxitos en c experimentos de Bernoulli es una variable discreta que se asocia con

117Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014

Definición 7.3.

Un proceso de Bernoulli tiene las siguientes propiedades:

1. Cada ensayo produce un resultado que se puede clasificar como éxito (E) ó fracaso (F).2. La probabilidad de un éxito, que se denota con , permanece constante de un ensayo a otro

(ensayos independientes).3. A priori se fija el número de repeticiones del ensayo (c).

Definición 7.4.

Un experimento binomial es un experimento que posee las siguientes propiedades:

1. El experimento consta de una cantidad fija de c ensayos o pruebas idénticas. 2. Cada prueba puede tener uno de dos resultados. Es decir los resultados son dicotómicos

Debido a la falta de una mejor nomenclatura, llamaremos convencionalmente a un resultado éxito (E) y al otro fracaso (F).

3. La probabilidad del evento éxito en una sola prueba es igual a , y permanece constante de una prueba a otra. La probabilidad del evento fracaso es (1-).

4. Las pruebas son independientes. 5. Interesa conocer x, que es el número de éxitos observados en c pruebas.

Resultado x i

Ningún defectuoso DDD 0

Uno defectuosoDNN 1

11

NDNNND

Dos defectuososDDN 2DND 2NDD 2

Tres defectuosos DDD 3

Page 14: Variable Aleatoria Discreta y Distribuciones Discretas de Probabilidad (Tema 6)

UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD

una variable aleatoria binomial. La distribución de probabilidad de una variable binomial se llama distribución binomial, y los correspondientes valores de la función de probabilidad se denotan como b (x ;c ,π ), lo que indica que c (número fijo de ensayos Bernoulli) y π (probabilidad del evento éxito) son los parámetros de tal distribución. Se justificará ahora la expresión presentada.

Para desarrollar la fórmula de la probabilidad de x éxitos en c pruebas, para un experimento binomial:

1º) se considerará un orden específico de x éxitos y (c-x) fracasos; la probabilidad de este resultado en particular, debido a que las pruebas (c=3) son independientes se obtiene al multiplicar las correspondientes probabilidades de los diferentes resultados para cada prueba experimental. Por otra

parte se conoce que cada éxito ocurre con una probabilidad π y cada fracaso con probabilidad (1−π ). Por tanto, la probabilidad para el orden específico es π x (1−π )( c− x ).

Ilustración: en el ejemplo de control de calidad productiva (c=3), se considerará el resultado (NDN), esto es resulta N en la primera prueba; en la segunda D y en la tercera N. Como se conoce que históricamente el proceso produce alrededor de un 25% de artículos defectuosos, se puede suponer que la probabilidad de éxito es = 1/4, de modo que 1- = 3/4. Luego:

P ( N∩D∩N ) =P ( N ) . P (D ) . P (N )=( 34 )( 1

4 )( 34 )= 9

64

Pero el resultado “una sola de las tres unidades es defectuosa” se corresponde con tres puntos del espacio muestral.

2º) Se debe determinar ahora el número total de puntos muestrales en el experimento que tiene x éxitos

y (c-x) fracasos. Este número es igual al número combinatorio (cx ) dado por la regla de conteo para el

caso sin reposición y sin orden, que en este contexto recibe el nombre de coeficiente binomial.

Ilustración: de esta manera las probabilidades asociadas a los valores posibles de la variable aleatoria Por, de interés resultan ser

x i

0 1 2 3P(X=x)=p(x)

2764

964

964

164

donde se observa que la probabilidad de dos artículos defectuosos calculada aplicando la función de probabilidad es igual a

p ( X=2 )= p (2 )=b (x=2 ;c=3 , π= 14 )= 9

64

6.6.3 Funciones de probabilidad de la VAB

Definición 7.5.

Sea X una variable aleatoria discreta que representa el número de éxito en c ensayos y π la probabilidad de éxito con cualquiera de éstos.

1) Se dice que X tiene una distribución binomial con función de probabilidad:

b ( x ;c , π )=C xc πx (1−π )(c− x )=(c

x)π x (1−π )(c−x ) siendo x=0,1,2 ,…, c y 0≤ π ≤1

P ( X=x )=p ( x )=b ( x ;c ,π )={ c !(c−x ) ! x !

πx (1−π )(c− x ) parac entero;0≤ π≤ 1

0 para cualquier otrovalor

donde p(x): da la probabilidad de la ocurrencia de exactamente x veces el evento éxito.c: número fijo de pruebasπ : probabilidad de éxito en una sola prueba(1−π ) : probabilidad de fracaso de una sola prueba

118Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014

Page 15: Variable Aleatoria Discreta y Distribuciones Discretas de Probabilidad (Tema 6)

p(xI)

0 1 2 3 4 X

UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD

Cxces el coeficiente binomial dado por

c !(c−x )! x !

2) La probabilidad de que una variable aleatoria X sea menor o igual a un valor específico de x, se determina por la función de la distribución acumulada

P ( X ≤ x )=F ( x )=F ( x ;c , π )=∑xi ≤ x ( c

xi)π x i (1−π )( c−x i) ;con i=1,2 ,…(c+1)

donde F(x): da la probabilidad de la ocurrencia de x veces o menos del evento éxito.

Propiedades

Parámetros del modelo c ,π

Esperanza matemática o media

E [ X ]=μ=cπ

Varianza V [ X ]=σ 2=cπ (1−π )

Desviación estándar σ =√V [ X ]

6.6.4 Aplicaciones de la distribución binomial

Nota: Al graficar la función de probabilidad de una variable aleatoria discreta (gráfico de líneas), se debe tener en cuenta que en el eje de abscisas se representan los valores de la VAD X, y en el

eje de ordenadas se representan las probabilidades puntuales o probabilidades masa p( x ) , correspondientes a dichos valores de la variable

Gráfico 7.3. Función de probabilidad de una VAB

Otros ejemplos de distribuciones de VAB

(a) (b)

(c)

Gráfico 7.4. Distribuciones de probabilidad binomial para (a) c=10, π =0,10; (b) c=10, π =0,50; y (c)

119Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014

Page 16: Variable Aleatoria Discreta y Distribuciones Discretas de Probabilidad (Tema 6)

UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD

c=20, π =0,50

Notar: que la distribución binomial resulta simétrica cuando π =1/2; mientras que si π 1-πresulta asimétrica positiva.

Gráfico 7.5. Función de distribución acumulada de una VAB

Nota: Al graficar la distribución de probabilidad acumulada simbolizada como F(x), que se corresponde con un gráfico escalonado, para una variable binomial se debe tener en cuenta que en el eje de abscisas se representan los valores de la VAD X, y en el eje de ordenadas se representan las probabilidades acumuladas, F(x), correspondientes a dichos valores de la variable.

Ejemplo 7.4: Las observaciones durante un largo período muestran que la probabilidad de vida de un cierto componente de la fauna silvestre en los primeros cinco años de vida es de 0,2. Supóngase que un investigador procura una muestra de cuatro animales de la especie y le quiere hacer seguimiento del ciclo de vida.

a) ¿Cuál es la probabilidad de que exactamente dos animales sobrevivan?b) ¿Cuál es la probabilidad de que al menos dos animales sobrevivan? c) ¿Cuál es la probabilidad de que todos los animales sobrevivan?a)

p( x )=Cx4(0,2 )x (0,8)4−x ; p (2 sobrevivientes ) = p(2 )=C2

4 (0,2)2 (0,8)2

p (2)=4 !2 !2 !

(0 , 04 )(0 , 64 )=0 ,15

b)

P(almenos . dos )= P ( X ≥ 2 ) = p (2 )+ p(3 )+ p (4 )=1− p(0 )− p(1 )=1−C0

4 (0,2)0 (0,8 )4−C14 (0,2)1(0,8 )3

=1−0 , 4096−0 , 4096=0 , 19c)

p( 4 )=C44 (0,2)4 (0,8 )0

=4 !4 ! 0!

(0,2 )4 (1)=0 ,0016

Ejemplo 7.5: Se inspeccionan los grandes lotes de productos que llegan a una planta manufacturera a fin de encontrar artículos defectuosos, mediante un plan de muestreo. Se selecciona una muestra aleatoria de n artículos de cada uno de los lotes y se inspeccionará la muestra, anotando el número x de defectuosos. Si X es menor que o igual a algún número de aceptación a especificado, se aceptará el lote. Si X es mayor que a, se rechazará el citado lote. Supóngase que un fabricante utiliza un plan de muestreo con c = 10 y a = 1. Si el lote contiene exactamente 5% de artículos defectuosos, ¿cuál es la probabilidad de que el lote sea aceptado? ¿Cuál es la probabilidad de que sea rechazado?

Bajo la suposición de que el lote contiene 5% de defectuosos, la probabilidad de que un artículo,

extraído de él sea defectuoso, es π =0,05. Entonces la probabilidad de observar x defectuosos en una muestra de c=10 artículos es:

p( x )=Cx10(0 ,05 )x( 0 ,95 )10−x

Se ha especificado que el lote será aceptado, cuando x sea menor o igual que al número de aceptación a=1. Por lo tanto, la probabilidad de aceptación de un lote con estas características es:

P(aceptar )= p(0 )+ p (1)=C010(0 , 05)0 (0 , 95 )10+C1

10(0 ,05)1 (0 ,95)9=0 ,914P(rechazar )=1−P( aceptar )=1−0 ,914=0 ,086

Ejemplo 7.6: Una representación gráfica de la probabilidad de aceptación del lote, contra la fracción de

defectuosos π , se llama curva característica de operación de un plan de muestreo para aceptación de lotes. Calcular la probabilidad de aceptación de lotes en el caso de un plan de muestreo con un

120Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014

Page 17: Variable Aleatoria Discreta y Distribuciones Discretas de Probabilidad (Tema 6)

UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD

tamaño muestral c=5 y un número de aceptación a=0 para las fracciones de defectuosos del lote considerando =0,1; 0,3 y 0,5.

P(aceptar )= p(0 )=(50 ) p0 q5=q5

P(aceptar|p=0,1 )=( 0,9)5=0 ,590P(aceptar|p=0,3 )=(0,7 )5=0 ,168P(aceptar|p=0,5 )=(0,5)5=0 ,031

Con los resultados se puede trazar la curva de operación característica para el plan de muestreo (3 puntos intermedios de la curva). Adicionalmente se que la probabilidad de aceptación tiene que ser

igual a 1 cuando π =0 y tiene que ser 0 cuando π =1.

p Gráfico 7.6. Curva característica de operación para c=5 y a=0

.

2.2.1. Tablas de probabilidad para la distribución binomial

El cálculo de probabilidades binomiales es un trabajo tedioso cuando c es grande. Para simplificar los cálculos, se recurre a una tabla de la función de distribución F(x), que da la suma de las

probabilidades binomiales desde x=0 hasta x=c, para c = 5, 10, 15, 20 y 25, y diferentes valores de π .

Para mostrar como utilizar la tabla, supóngase que se desea encontrar la suma de las

probabilidades binomiales desde x = 0 hasta x = 3, para un experimento binomial con c = 5 pruebas y π=0,3. Es decir, se quiere calcular

∑x=0

3

p ( x )= p(0 )+ p(1)+ p(2 )+ p (3)

donde p( x )=(5x )(0,3)x(0,7 )5−x

Para entrar en la tabla, primero hay que localizar a c=5. Luego, ya que los valores tabulares dan

∑x=0

a

p ( x ), se busca el valor tabulado en la fila correspondiente a x=3 y en la intersección con la columna

de π =0,3 se encuentra el valor tabulado buscado: 0,9692, que corresponde a la suma de las

probabilidades binomiales desde x=0 hasta a=3 (para c=5 y π =0,3), esto es

F(3) = ∑x=0

3

p ( x ) = 0,9692.

Tabla 7.1. Fragmento de una tabla de valores de la función de distribución acumulada binomial

c x

0.01 0.05 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 0.95 0.99 c5 0 - - - - - - - - - - - - - 0

1 - - - - - - - - - - - - - 12 - - - - 0,8369 - - ---- - - - - - 23 - - - - 0,9692 - - --- - - - - - 34 - - - - - - - - - - - - - 4

La tabla puede utilizarse también para encontrar una probabilidad binomial específica, por ejemplo p(3)

para c=5, π =0,6. En este caso se procede según

121Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014

Page 18: Variable Aleatoria Discreta y Distribuciones Discretas de Probabilidad (Tema 6)

UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD

p(3 )=[ p(0 )+ p (1)+ p(2 )+ p (3 )]−[ p(0 )+ p(1)+ p(2 )]

=∑x=0

3

p (x )−∑x=0

2

p (x )

=0 , 9692−0 , 8369=0 , 1323

Por lo tanto, un valor individual de p(x) es igual a la diferencia entre dos sumas que son entradas adyacentes, dadas en una columna de la tabla.

Ejemplo 7.7. Obtener la media y la desviación típica para la distribución de probabilidad binomial

relacionada con un experimento donde c=10 y π =0,1 y calcular la probabilidad de que X caiga en el

intervalo ( μ±2 σ ) .

La media y la desviación típica para la distribución de probabilidad de la VAB resultan

μ=cπ=(10)(0,1 )=1σ=√cπ (1−π )=√ (10 ) (0,1 ) (0,9 )=0 ,95

El valor paramétrico de μ=1 indica el centrado del gráfico de probabilidades y el intervalo μ±2σ=1±2(0 , 95)=1±1 ,90=−0,9≤μ≤2, 90

muestra que x=0, 1, 2. Por lo tanto, la probabilidad de que x caiga en el intervalo ( μ±2 σ ) es igual a

p(0 )+p (1)+ p(2 )=∑x=0

2

p (x )

Esta probabilidad acumulada se encuentra en la tabla de la función de distribución de la VAB para c=10, p=0,1 y x=2, como 0,930.

Si consideramos la distribución de probabilidad como una distribución de frecuencias relativas para una población teórica de valores x, entonces 93% de todas las observaciones en la población

caerán en el intervalo ( μ±2 σ ) . Este resultado concuerda con el Teorema de Tchebysheff y razonablemente bien con la Regla Empírica.

Ejemplo 7.8. Suponga que un docente investiga sobre las características de los resultados de una prueba de opción (o elección) múltiple. Una calificación de 0 en una prueba objetiva indica que el alumno no pudo recordar el o los conceptos involucrados de la prueba en el momento en que se realizó el examen. También puede suceder que se obtenga el puntaje asignado habiendo contestado correctamente por pura suerte, ya que se desconocía el tema. Por consiguiente, un alumno sin saber puede obtener en una prueba de opción múltiple una calificación final muy por arriba de O. Si se toma una prueba de esta clase con 100 preguntas, cada una con seis respuestas posibles,

a) ¿cuál será la calificación esperada para una persona que no tiene conocimiento del material para la prueba?

b) ¿Entre qué limites caerán las calificaciones de no conocimiento?

a) Sea π igual a la probabilidad de una opción correcta en una sola pregunta y sea X el número de respuestas correctas para las 100 preguntas (c=100). Suponiendo que el no conocimiento indica que la

persona escogerá al azar una de las seis respuestas posibles para cada pregunta, resulta π =1/6. Entonces para c=100 preguntas, la calificación esperada para un estudiante con ningún conocimiento, es E(x), donde

E ( x )=cπ=100( 16 )=16 , 7

Para evaluar la variación de las calificaciones de no conocimiento, se necesita conocer el valor de , donde

σ =√cπ (1−π)=√(100)( 16 )( 5

6 )=3,7

b) Por el conocimiento del Teorema de Tchebysheff y de la Regla Empírica3 se puede esperar que la

mayoría de las calificaciones de no conocimiento caigan en el intervalo ( μ±2 σ ) , o bien [16.7 ± 2 x 3,7], o sea desde 9,3 hasta 24,1. Este resultado puede compararse con la calificación de cero para una persona sin conocimiento que se somete a una prueba objetiva de recordar.

.

3 Un histograma para p(x) con c=100, π =1/6 tendrá forma de pico de montaña. Por lo tanto, se esperaría que la Regla Empírica funcionara bien.

122Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014

Page 19: Variable Aleatoria Discreta y Distribuciones Discretas de Probabilidad (Tema 6)

UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD

6.7DISTRIBUCIÓN DE POISSON

6.7.1 GeneralidadesDespués de conocida la aplicación hecha por S. D. Poisson, se encontró que la distribución de

Poisson describía con mucha precisión la probabilidad de las muertes producidas en el ejército prusiano a causa de las coces de los caballos, así como del número de suicidios de mujeres y niños. Una aplicación más contemporánea ha sido la modelación del número de bombas arrojadas por aviones con impacto/cuadrícula territorial durante la segunda guerra mundial y el número de avistajes de objetos voladores no identificados/espacio geográfico. En el campo profesional de las carreras de la Facultad también encuentra importantes aplicaciones asociadas a eventos raros, que son aquellos con baja probabilidad de ocurrencia como la distribución de fallas en relación al control de calidad (nº de defectos/artículo, nº de reparaciones en mantenimiento industrial, etc.), o el patrón de la variabilidad correspondiente a la distribución de la abundancia de especímenes de aves y de insectos en fracciones espaciales (áreas en: m2, km2, etc.), cabezas de ganado por hectárea, cantidad de huevos de un insecto en una oviposición, así como el número de bacterias por muestra de agua potable o de nemátodos por unidad de volumen del suelo y otros. También la distribución de probabilidades discreta de Poisson tiene actualmente un amplio abanico de aplicaciones en el área de la investigación de operaciones, con relación al número de llegadas o solicitudes de servicio por unidad de tiempo en los puestos de peaje de una vía férrea, en las cajas registradoras o cajas bancarias, o la utilización de las pistas de aterrizaje de un aeropuerto. En medicina la variable número de llegada de infartados a un centro de atención es una variable Poisson.

Gráfico 7.7. Parte de un rollo de papel y área base para contar la ocurrencia de fallas.

Se llaman experimentos de Poisson a aquellos experimentos que arrojan valores numéricos de una variable aleatoria X referidos al número de ocurrencias durante un intervalo dado de espacio o tiempo. El intervalo temporal puede tener cualquier longitud razonable al caso, como puede ser un minuto, un día, una semana, un mes o incluso un año, y el intervalo espacial podría corresponderse con un segmento de una línea, un área o un volumen.

Definición 7.6 Un experimento de Poisson se deriva del proceso de Poisson y tiene las siguientes propiedades:

1- El número de resultados que ocurren en un intervalo o región específica es independiente del número que ocurre en cualquier otro intervalo o región del espacio disjunto.

2- La probabilidad de que ocurra un solo resultado durante un intervalo muy corto o en una región pequeña es proporcional a la longitud del intervalo o al tamaño de la región, y no depende del número de resultados que ocurren fuera de este intervalo o región.

3- La probabilidad de que ocurra más de un resultado en tal intervalo corto o que caiga en tal región pequeña es insignificante

Para utilizar la distribución de Poisson en cálculo de las probabilidades para modelar el comportamiento de una VA, se requiere cumplir con cuatro supuestos básicos:

1) debe ser posible dividir el intervalo de tiempo considerado en un número grande de pequeños subintervalos, de manera que la probabilidad de ocurrencia en cada uno de ellos sea muy pequeña. 2) la probabilidad de una ocurrencia en cada uno de los subintervalos debe permanecer constante a lo largo del período que está considerándose. 3) la probabilidad de dos o más ocurrencias en cada subintervalo tiene que ser suficientemente pequeña como para ignorarla. 4) una ocurrencia (o no ocurrencia) en un subintervalo no debe afectar a otra ocurrencia (o no ocurrencia) en cualquiera de los otros subintervalos; es decir, las ocurrencias deben ser independientes. Consideremos el número de llegadas por hora a un banco.

A continuación se ilustran estos conceptos:

Suposición Ejemplo del banco

123Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014

X

X

X

X

Muestra

Page 20: Variable Aleatoria Discreta y Distribuciones Discretas de Probabilidad (Tema 6)

UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD

Es posible dividir el intervalo de tiempo considerado en pequeños subintervalos.

La probabilidad de una ocurrencia permanece constante a lo largo de los intervalos.

La probabilidad de dos o más ocurrencias en un subintervalo es suficientemente pequeña como para ignorarla.

Las ocurrencias son independientes.

Puede dividirse la hora en subintervalos de un segundo cada uno.

Se elige una hora en la que es razonable prever que el flujo de clientes es constante.

Es imposible que dos personas entren al banco simultáneamente (o sea, en el mismo segundo)

Las llegadas al banco no están incluidas por las dimensiones de la cola.

Resulta importante identificar que la unidad de medición de tiempo o de área presenta características de continuidad, pero que la variable aleatoria “número de ocurrencias” es discreta. Además, cabe notar que es imposible contar las ocurrencias del evento complementario, por ejemplo el número de accidentes que no ocurrieron, el número de llamadas que no se realizaron o el número de defectos que no se presentaron en un centímetro cuadrado.

6.7.2 Propiedades características de la distribución de Poisson

El número de éxitos en c experimentos de Bernoulli es una variable discreta que se asocia con una variable aleatoria El límite inferior del número de acaecimientos en todas esas situaciones es cero, y el límite superior - por lo menos teóricamente- es infinito, aun cuando en la mayoría de los ejemplos presentados sería difícil imaginar un número ilimitado de ocurrencias. De este modo, la variable Poisson, que toma valores de cero a un número infinito de ocurrencias por unidad, puede no representar exactamente cualquiera de los procesos aleatorios mencionados en páginas anteriores, pero en muchas oportunidades se ha demostrado que el modelo de Poisson resulta útil para aproximar estrechamente tales procesos.

6.7.3 Funciones de probabilidad de la VAP

Definición 7.7. Sea X una variable aleatoria discreta que representa el número de ocurrencias con relación a una base temporal o espacial.

1) Se dice que X tiene una distribución Poisson con función de probabilidad:

P( X =x )= p (x ) ={e−λ λx

x !para x=0,1,2 ,. . . λ>0

0 , en . los demás casos

donde p(x): da la probabilidad de que el evento x suceda exactamente k veces.: es un parámetro positivo que representa una tasa media de veces que puede esperarse la ocurrencia de un fenómeno en el intervalo considerado

e: es la base de los logaritmos naturales (e = 2,71828 ...)

2) La probabilidad de que una variable aleatoria X sea menor o igual a un valor específico de x, se determina por la función de la distribución acumulada

P ( X≤x )=F ( x ; λ )=∑x

i≤x

e−λ λxi

x i ! ; para xi.= 0,1, 2, 3, …. (7.4)

donde F(x): da la probabilidad de la ocurrencia de x veces o menos del evento éxito.

Propiedades

Parámetros del modelo λ

Esperanza matemática o media

E [ X ]=μ=λ

Varianza V [ X ]=σ 2=λ

Desviación estándar σ =√V [ X ]

El único parámetro necesario para caracterizar una población descrita por la distribución de Poisson es la tasa media de ocurrencia de los sucesos, simbolizada con la letra griega lambda (). Puede definirse lambda como la tasa media de ocurrencia por unidad de temporal o espacial considerada.

124Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014

Page 21: Variable Aleatoria Discreta y Distribuciones Discretas de Probabilidad (Tema 6)

UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD

Así, si =1,0 se refiere a la llegada de los clientes la un banco, la ley de probabilidad de Poisson está indicando que a largo plazo se produce a razón de 1,0 clientes por minuto, con una varianza de llegadas también igual a 1,0.

Aplicaciones de la distribución PoissonEn el gráfico 7.8 se ilustra una típica distribución de probabilidades de una VA Poisson.

Obsérvese que casi toda la probabilidad se concentra cerca del origen (valores 0, 1), y que la probabilidad de observar grandes valores de la variable aleatoria es muy pequeña. Cuando se dice que una variable aleatoria está distribuida según el modelo de Poisson, se suele interpretar que una distribución de frecuencias relativas de ocurrencias respecto a esa variable, tiene un patrón de variabilidad que se puede representar aproximadamente o razonablemente con tal modelo.

Gráfico 7.8. Distribución de probabilidades de una VA Poisson para =1,0

Debe notarse que aún cuando se considera que la VAP toma un número infinito de valores, tal como ocurre con todas las funciones de masa discretas sólo un número discreto de valores de x tienen probabilidades positivas, y los valores de probabilidad resultan muy pequeños a medida que los valores de x se diferencian más respecto a . Las gráficas típicas de las distribuciones de Poisson muestran una asimetría marcadamente positiva, pero cuando no tiene un valor muy cercano a cero, la forma de la distribución de Poisson es bastante simétrica. También por los axiomas de probabilidad se sabe que la suma de las probabilidades correspondientes a todos los valores de x debe ser igual a 1,0. En casos prácticos debido a que no se consideran infinitos valores de la variable, la suma solo resulta aproximada a 1,0.

Para las aplicaciones prácticas del modelo Poisson, es necesario determinar empíricamente la tasa media a la que ocurren los sucesos. Esto es, hay que conocer el valor de , quizá sobre la base de un estudio previo de la situación (muestra). Una vez conocido el valor de , se pueden utilizar las funciones de probabilidad de Poisson para determinar la probabilidad de que tengan lugar exactamente x ocurrencias o sucesos en el intervalo de tiempo especificado o bien la de un evento compuesto (X<5, etc.).

Muchas veces más que interesarse en valores específicos, interesa obtener conocimiento sobre el patrón de variabilidad de la VA vinculada con un fenómeno aleatorio de interés. En este caso el estudio también se inicia con la toma de una muestra, la obtención de su distribución de frecuencias y el cálculo de los estadígrafos media y desviación típica. Luego se procede a realizar un ajustamiento del modelo Poisson y se obtienen valores de frecuencias teóricas, tratando de tomar alguna idea acerca de la distribución poblacional correspondiente a la población de donde se extrajo la muestra. Con posterior ayuda de herramientas que proporcionará la Inferencia Estadística, se podrá establecer una conclusión probabilística al respecto.

Ejemplo 7.10: Las observaciones durante un período muestras que la probabilidad de vida de un cierto componente de la fauna silvestre en los primeros cinco años de vida es de 0,2 ( λ ). A partir de este conocimiento, puede calcularse la probabilidad de que sobrevivan x animales en ese período.

Ejemplo 7.11 Un zoólogo sabe por experiencia que en ciertas condiciones, la tasa media de insectos xilófagos que puede encontrarse en árboles que presentan una incipiente podredumbre es de =600. Se supone que los insectos van colonizando el fuste del forestal en forma constante a razón de 1 insecto por unidad de volumen de madera. Se desea determinar la probabilidad de encontrar:

a) exactamente dos insectos en una unidad de volumen seleccionada al azar. Siendo = 1 y x = 2, luego

P(2 insec tos) = p (2)=e−1(1 )2

2 != 1

2 e= 1

2 x 2 , 71828= 0 ,1839

a) Cuando más 2 insectos (2 o menos)

125Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014

Page 22: Variable Aleatoria Discreta y Distribuciones Discretas de Probabilidad (Tema 6)

UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD

P(2 . o .menos . insec tos)= P ( X ≤ 2 ) =P(0 )+P (1 )+P(2)

=e−1(1 )0

0 !+

e−1 (1)1

1 !+

e−1 (1)2

2 !=0 , 3679+0 , 3679+0 ,1839=0 , 9197

La probabilidad buscada se obtiene sumando los valores correspondientes a x = 0, 1 y 2.

Ejemplo 7.12 Se realizó un experimento de Poisson que consistió en observar la cantidad de clientes que pasó por una caja registradora de un supermercado en el horario nocturno. Se considera que las llegadas de los clientes a las cajas pueden seguir una distribución de Poisson durante ciertos periodos de tiempo.Los datos obtenidos se presentan en las dos primeras columnas de la siguiente tabla, construida para describir estadísticamente la muestra.

Tabla 7.3. Distribución muestral del número de clientes que llega a una caja mercadista(1)

Cantidad de

llegadas (x)

(2)Nº de

clientes

(3)Frec.

relativasf/n

(4)

xfn

(5)

x2

(6)

x2 fn

0 0 0.01 0.00 0 0.001 8 0.08 0.08 1 0.082 19 0.19 0.38 4 0.763 23 0.23 0.69 9 2.074 17 0.17 0.68 16 2.725 15 0.15 0.75 25 3.756 8 0.08 0.48 36 2.887 3 0.03 0.21 49 1.478 3 0.03 0.24 64 1.929 2 0.02 0.18 81 1.62

10 1 0.01 0.10 100 1.00Total 100 1.00 3.79 18.27

Utilizando el enfoque empirista de la probabilidad, se obtendrán los parámetros de la distribución probabilística de la variable Poisson empleando las frecuencias relativas para ponderar los valores de la variable.

E [ X ]=∑ x i f i=3,79 clientes/u . de tiempo

V [ X ]=σ 2=E [ X2 ]−( E [ X ] )2=∑ x i2 f i−(∑ xi f i )

2=18,27−(3,79 )2

σ 2=3,91 (cientes /u . de tiempo )2

Recuérdese que, en la distribución de Poisson, y 2 toman el mismo valor, pero su interpretación respectivamente es con relación al centrado y a la variabilidad. Se observa que el resultado obtenido es favorable al supuesto de que las llegadas de los clientes a las cajas pueden seguir una distribución de Poisson durante ciertos periodos de tiempo. Dado que se tienen datos muestrales (n=100) nunca se obtendrán valores exactamente iguales, pero como hay escasa diferencia esto da confianza respecto a la suposición planteada.

Otro análisis a realizar para obtener mayor información consiste en realizar un ajustamiento del modelo Poisson. Se empleará con esta finalidad una tabla cuyo encabezamiento es el siguiente:

Tabla 7.4. Ajustamiento del modelo Poisson a la distribución del número de clientes que llega a una caja mercadista

(1)Cantidad de

llegadas (xi)

(2)Nº de clientesobservados

(ni)

(3)

p ( x i )

(4)Nº de clientes

esperados

(ni

¿

)

La columna última de esta tabla contiene las frecuencias teóricas (n̂ i), calculadas utilizando el modelo Poisson. Esta serie de frecuencias debe compararse con las correspondientes frecuencias observadas de la segunda columna (ni), Cuanto mayor sea la similitud, significa que se tiene más información empírica a favor de la suposición planteada inicialmente, y contrariamente, si se observan discrepancias notables se comenzará a sospechar que habrá que describir el comportamiento de la variable observada utilizando otro modelo para acercarse al conocimiento de la verdadera distribución de la población de donde se extrajo la muestra.

Herramientas que proporcionará la Estadística Inferencial permitirán dilucidar este problema y alcanzar una conclusión en términos probabilísticos acerca de la distribución poblacional.

126Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014

Page 23: Variable Aleatoria Discreta y Distribuciones Discretas de Probabilidad (Tema 6)

UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD

Tablas de probabilidad para la distribución Poisson

En realidad, las tablas de la función de distribución de Poisson, F(x), se utilizan de modo muy semejante a las tablas binomiales, aunque a primera vista no lo parezcan. Como la distribución de Poisson es una función sólo de la media del proceso, las tablas están diseñadas para proporcionar las probabilidades con base en la media del proceso para diferentes valores de la variable X.

Tabla 7.5. Fragmento de una tabla de distribución de probabilidad acumulada de Poisson

La tabla proporciona sumas de probabilidades, al igual que la tabla binomial acumulativa, para x o menos ocurrencias P(X x), dada la media del proceso ()4. Además si bien da valores de probabilidad para una función de distribución acumulada, también puede utilizarse con criterios similares a los vistos en el caso Poisson para encontrar una probabilidad Poisson específica, P(X=x) = p(x).

Ilustración. Probabilidades obtenidas a partir de la tabla acumulativa de Poisson Probabilidad deseada para Incluir los resultados Cálculos Probabilidad

0.8 x ≤ 1 0, 1 Se lee directamente 0.8091.2 x < 3 0, 1, 2 Se lee P(x ≤ 2) 0.8791.5 x = 0 0 Se lee directamente 0.223

2.0 x > 3 4, 5, 6, … 1−P ( x≤3 ) 0.143

2.6 1 < x ≤ 4 2, 3, 4 P( x≤4 )−P( x≤1 ) 0.610

3.8 1 ≤ x ≤ 4 1, 2, 3, 4 P( x≤4 )−P( x=0 ) 0.646

5.6 1 ≤ x ≤ 4 1, 2, 3, 4 P( x≤4 )−P( x≤1 ) 0.338

6.0 x ≥ 5 5, 6, 7, … 1−P( x≤4 ) 0.715

Para valores de que no se encuentran en la tabla, se puede encontrar una más amplia, o interpolar (en el caso de valores aproximados) en la tabla, o recurrir a las fórmula dadas.

4 Hay bibliografía que utiliza el símbolo en lugar de 127

Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014

x