23
1 MODELOS ESPECIALES DE PROBABILIDAD Sumario: 1. Distribución Lognormal. 2. Las funciones Gamma y Beta. 2.1. Función Gamma. 2.2. Función Beta. 3. Proceso de POISSON. 3.1. Distribución de POISSON. 3.2. Cálculo aproximado de la distribución Binomial. 3.3. Distribución Exponencial. 3.4. Distribución Gamma. 3.5. Distribución Gamma de parámetro r no entero. 4. Distribución Beta. 5. Apéndices. 5.1. Demostración de la ley Exponencial de fallas. 5.2. Demostración de la función de probabilidad de POISSON. 1. Distribución Lognormal Se dice que una variable aleatoria tiene distribución Lognormal o Normal logarítmica si su logaritmo, en cualquier base, tiene distribución Normal. Dicho de otro modo, si x es una variable con distribución Lognormal, entonces y=Ln x tiene distribución Normal. Esta es la ley que rige los ingresos de grandes grupos de individuos, donde las variaciones de la variable se observan entre distintos individuos o unidades experimentales en un momento fijo del tiempo y no sobre un individuo a través del tiempo. Así, decimos que se trata de una variable trasversal o de sección trasversal cross section en terminología anglosajona. Aclaremos además, que llamamos variable temporal a aquella cuyos valores se observan a través del tiempo, para la cual son válidos otros tipos de modelos el Gaussiano entre otros . La función de densidad de esta distribución tiene la forma de la Fig. 8.1, que representa los consumos de energía eléctrica de Buenos Aires y Gran Buenos Aires. En la Sección 1 del Capítulo 6 explicamos el motivo de su asimetría. Veamos ahora una prueba sencilla de que su logaritmo puede tener distribución Normal. Supongamos que una persona comienza su vida laboral en una empresa, ganando un sueldo inicial de A$; tiempo después, por algún motivo, recibe un aumento de sueldo, digamos del 10%, con lo cual su ingreso pasa a ser A×1,1; luego, recibe un aumento del 5%, con lo cual pasa a ganar A×1,1×1,05; así siguiendo, su salario se va modificando del siguiente modo, hasta llegar a su salario actual x: A×1,1×1,05×... = x Este salario x queda formado como un producto de variables aleatorias, cuyo logaritmo será entonces la suma de los logaritmos de los factores y por lo tanto, el logaritmo del salario resulta ser una suma de variables aleatorias que, en virtud del Teorema Central del Límite (Capítulo 6), se espera que tenga, al menos aproximadamente, distribución Normal. Véase en Klein (1966) un análisis más completo sobre esta cuestión. Así pues, el modelo Lognormal tiene un sustento teórico o analítico, pero también ha sido verificado experimentalmente con adecuados procedimientos de ajuste, por lo tanto, siempre que tengamos una variable económica o financiera de corte trasversal, deberemos considerar al Lognormal como un posible candidato. El tipo de prueba que hemos dado para el modelo Lognormal es bastante frecuente en Estadística. Es decir, no se pretende un rigor matemático profundo, sino tan sólo un análisis que nos permita considerarlo como un candidato plausible, pues pueden darse casos en los cuales deba recurrirse a otro tipo de modelo; luego, en el Capítulo 10, trataremos brevemente la distribución propuesta empíricamente por WILFREDO PARETO, para salarios de una empresa. La función de densidad de probabilidad (Fig. 8.1) es Fig. 8.1 0 200 400 600 800 1000

MODELOS ESPECIALES DE PROBABILIDAD

  • Upload
    others

  • View
    7

  • Download
    0

Embed Size (px)

Citation preview

Page 1: MODELOS ESPECIALES DE PROBABILIDAD

1

MODELOS ESPECIALES DE PROBABILIDAD

Sumario: 1. Distribución Lognormal. 2. Las funciones Gamma y Beta. 2.1. Función

Gamma. 2.2. Función Beta. 3. Proceso de POISSON. 3.1. Distribución de POISSON. 3.2.

Cálculo aproximado de la distribución Binomial. 3.3. Distribución Exponencial. 3.4.

Distribución Gamma. 3.5. Distribución Gamma de parámetro r no entero. 4. Distribución

Beta. 5. Apéndices. 5.1. Demostración de la ley Exponencial de fallas. 5.2. Demostración

de la función de probabilidad de POISSON.

1. Distribución Lognormal

Se dice que una variable aleatoria tiene distribución Lognormal o Normal logarítmica

si su logaritmo, en cualquier base, tiene distribución Normal. Dicho de otro modo, si x es una

variable con distribución Lognormal, entonces y=Ln x tiene distribución Normal. Esta es la ley que

rige los ingresos de grandes grupos de individuos, donde las variaciones de la variable se observan

entre distintos individuos o unidades experimentales en un momento fijo del tiempo y no sobre un

individuo a través del tiempo. Así, decimos que se trata de una variable trasversal o de sección

trasversal cross section en terminología anglosajona. Aclaremos además, que llamamos variable

temporal a aquella cuyos valores se observan a través del tiempo, para la cual son válidos otros tipos

de modelos el Gaussiano entre otros .

La función de densidad de esta

distribución tiene la forma de la Fig. 8.1,

que representa los consumos de energía

eléctrica de Buenos Aires y Gran Buenos

Aires. En la Sección 1 del Capítulo 6

explicamos el motivo de su asimetría.

Veamos ahora una prueba sencilla de que su

logaritmo puede tener distribución Normal.

Supongamos que una persona comienza su

vida laboral en una empresa, ganando un

sueldo inicial de A$; tiempo después, por

algún motivo, recibe un aumento de sueldo,

digamos del 10%, con lo cual su ingreso pasa a ser A×1,1; luego, recibe un aumento del 5%, con lo

cual pasa a ganar A×1,1×1,05; así siguiendo, su salario se va modificando del siguiente modo, hasta

llegar a su salario actual x:

A×1,1×1,05×... = x

Este salario x queda formado como un producto de variables aleatorias, cuyo logaritmo

será entonces la suma de los logaritmos de los factores y por lo tanto, el logaritmo del salario resulta

ser una suma de variables aleatorias que, en virtud del Teorema Central del Límite (Capítulo 6), se

espera que tenga, al menos aproximadamente, distribución Normal. Véase en Klein (1966) un análisis

más completo sobre esta cuestión.

Así pues, el modelo Lognormal tiene un sustento teórico o analítico, pero también ha sido

verificado experimentalmente con adecuados procedimientos de ajuste, por lo tanto, siempre que

tengamos una variable económica o financiera de corte trasversal, deberemos considerar al Lognormal

como un posible candidato.

El tipo de prueba que hemos dado para el modelo Lognormal es bastante frecuente en

Estadística. Es decir, no se pretende un rigor matemático profundo, sino tan sólo un análisis que nos

permita considerarlo como un candidato plausible, pues pueden darse casos en los cuales deba

recurrirse a otro tipo de modelo; luego, en el Capítulo 10, trataremos brevemente la distribución

propuesta empíricamente por WILFREDO PARETO, para salarios de una empresa.

La función de densidad de probabilidad (Fig. 8.1) es

Fig. 8.1

0 200 400 600 800 1000

Page 2: MODELOS ESPECIALES DE PROBABILIDAD

2

(8.1)

2

2

2

)(

π2

1)(

D

mxLnExp

xDxf

válida en el dominio x>0. Los parámetros m y D son la media y el desvío estándar del logaritmo de

la variable, es decir:

(8.2)

0)()(E mdxxfxLnxLn

(8.3) E[(Ln x m)²] =

0

22)()( DdxxfmxLn

que están relacionados con la media µ y el desvío estándar de la variable, pues

(8.4) µ = E(x) =

0 2)(

2D

mExpdxxxf

(8.5) 2 = E[(x µ)²] =

0)()(

2dxxfx = Exp(2m+D²)[Exp(D²) 1]

Si disponemos de un conjunto de observaciones de una variable, sobre la que tenemos una

razonable seguridad de que responde al modelo Lognormal, podemos estimar sus parámetros m y D.

Indicamos los dos procedimientos fundamentales para ello.

Sean las observaciones X1, X2, ..., Xn. Dado que m es la esperanza matemática del logaritmo

de la variable, es razonable estimarlo como:

(8.6)

n

iiXLn

nm

1

Análogamente, podemos poner:

(8.7)

n

imXLn

nD i

1

22)ˆ(

1

Las expresiones (8.6) y (8.7) son los estimadores por máxima verosimilitud de los

parámetros de la distribución Lognormal. En el capítulo sobre estimación de parámetros discutiremos

con cierto detalle ese método de estimación, atribuido a FISHER, pero cuyo origen es muy anterior,

dado que procede de GAUSS.

Otra forma de estimar los parámetros m y D es utilizar las relaciones (8.4) y (8.5),

resolviéndolas para m y D, en función de µ y , como sigue:

(8.8)

2

2

2

σ1;

)/σ(1

LnDLnm

Luego, se reemplazan en estas expresiones los parámetros µ y por sus estimaciones X

y S, para obtener las estimaciones de m y D. Este procedimiento para estimar los parámetros se

denomina Método de los Momentos, y se debe a KARL PEARSON (1857-1936), insigne estadístico

inglés, pionero de nuestra ciencia.

El Modo o Moda es el valor de la variable que maximiza la función de densidad. Dado que

en este caso la curva representativa de (8.1) es acampanada, es posible calcular dicho valor derivando

Page 3: MODELOS ESPECIALES DE PROBABILIDAD

3

la función e igualando a cero dicha derivada, es decir, resolviendo la ecuación f '(x)=0; el valor de x

que se obtiene es el modo:

(8.9) Modo = Exp(m D²)

Digamos finalmente que el cálculo de la función de distribución F(x), o sea la probabilidad

de no superar un dado valor de x, se realiza con la tabla de la distribución Normal, mediante la

siguiente relación:

(8.10) F(x) =

x

D

mxLndxxf

0)(

Ejemplo 1. Los consumos telefónicos de las casas de familia de Buenos Aires, tienen una

media de 850 pulsos, con un desvío estándar de 625 pulsos, para el último bimestre del año. Calcular:

a) Los parámetros m y D. b) El modo y la mediana. c) El porcentaje de usuarios con consumos

superiores a la media.

Solución: a) Por supuesto que la distribución es Lognormal. Los parámetros m y D se

obtienen mediante las expresiones (8.8), de las que resulta:

2)/σ(1

Lnm = 6,5291

2

σ1

LnD = 0,6574

b) Calculamos el modo mediante (8.9), resultando igual a 444pulsos

La mediana es el valor de la variable tal que F(x)=0,5. Aplicando (8.10), tenemos

05,0

ZD

mMLn d

de donde Md = em = 685pulsos

c) El porcentaje de usuarios con consumos superiores a la media será

%1,37371,0629,01)329,0(1850

1)850()(

D

mLnxPxP

En general, las variables a las que se ajusta el modelo Lognormal tienen elevados

coeficientes de variación, esto es, su desvío estándar no es pequeño frente a la media, sino que es

comparable con ella y frecuentemente es mayor, algunas veces mucho mayor. Tenemos casos en que

el desvío es dos, tres y hasta seis veces la media.

2. Las funciones Gamma y Beta

Page 4: MODELOS ESPECIALES DE PROBABILIDAD

4

Por su importancia y utilidad en diversas distribuciones (Gamma, Beta, de WEIBULL, de

GUMBEL, etc) que trataremos en estos capítulos sobre modelos especiales (este y el 10) haremos aquí

un breve estudio de las llamadas integrales eulerianas:

(8.11)

0

1)( dyey

yrr (Función Gamma)

(8.12) 1

0

11 )1(),( dyyy babaB (Función Beta)

2.1. Función Gamma

La integral paramétrica (8.11) que define la función Gamma, es convergente siempre que

sea r>0. Integrando por partes se obtiene la relación fundamental

(8.13) (r) = (r1)(r1)

Además, como (1)=1, para valores enteros de r es

(8.14) (r) = (r1)! (r entero 1)

Por lo tanto, la función Gamma es una generalización del factorial. Por lo mismo, al ser

(1)=1, resulta 0!=1, hecho que se da como impuesto cuando se define el factorial de un número.

Como la integral (8.11) está definida para r>0 real, con la relación (8.13), es posible

calcularla para cualquier r, si se dispone de una tabla para un intervalo unitario. La planilla EXCEL

suministra su logaritmo natural con la función =GAMMA.LN(r). Además, tenemos una expresión

sencilla para valores semienteros de r, que obtendremos a partir de la integral que calculamos en el

Capítulo 6 (Sección 2.4):

(8.15)

0

2/12

22

1)( b

bdxbxExpI

Pongamos en (8.11) r=1/2

0

2/1

2

1dyey y

Ponemos y=x2, dy=2xdx y queda

0 0

2

2

222

1dxexdx

x

e xx

La última integral se identifica con (8.15) para b=1, por lo tanto

(8.16) π2

1

Con (8.13) obtenemos sucesivamente

π2

1

2

3

Page 5: MODELOS ESPECIALES DE PROBABILIDAD

5

π4

2

1

2

3

2

5

(8.17) π

!2

12

)!1(

2 1

n

nn

n

(n impar 1)

Una fórmula apropiada para el cálculo numérico es

(8.18) ))...(1(1680

1

1260

1

360

1

12

1π2)1()(

753nrrrLn

yyyyyLnyLnyaLn

siendo y=r+n+1 con n entero tal que r+n>8.

En el Capítulo 10, en la discusión de las distribuciones de GUMBEL, tendremos que utilizar

la derivada de la función Gamma, o sea:

(8.19)

0

1)(')(

ydyLneyrdr

rd yr

Para r=1, se tiene el resultado notable

(8.20) CydyLne y

0

)1('

siendo C la denominada Constante de EULER, definida como

(8.21)

nLn

nLímCn

1...

3

1

2

11 0,577256649

un número que, al día de hoy, no se ha podido demostrar siquiera que es irracional, aunque, por

supuesto, se sospecha que es irracional trascendente, como y e. Este número notable aparecerá en la

expresión de la media de las distribuciones de GUMBEL, que tienen diversas aplicaciones en

Ingeniería.

2.2. Función Beta

En el estudio de la distribución Beta, que veremos en este capítulo, aparecerá la integral

paramétrica

(8.22) 1

0

11 )1(),( dyyy babaB

denominada función Beta, que está definida para a>0 y b>0.

Es importante su relación con la función Gamma

(8.23) )(

)()(),(

ba

babaB

cuya demostración puede verse, por ejemplo, en DeGroot (1988).

3. Proceso de POISSON

Un proceso de POISSON es una sucesión de fallas o acontecimientos puntuales, que ocupan,

individualmente, una porción despreciable en un medio continuo, de modo que la probabilidad de que

ocurra un número dado r de fallas en una extensión t de continuo es independiente de la posición de t

Page 6: MODELOS ESPECIALES DE PROBABILIDAD

6

dentro del continuo y de la ocurrencia de fallas en otros tramos del continuo, esto es, que las fallas no

se producen en "trenes" y el proceso no tiene memoria. Así, son ejemplos de este tipo de proceso, los

siguientes:

* Cortes de luz en una ciudad

* Llamadas telefónicas a una línea

* Llegadas de personas a un comercio

* Fallas de aislación en un proceso de fabricación de cable plástico

* Fallas en los rollos de alfombra moqueta

* Goles en un partido de fútbol

* Accidentes de tránsito en una ciudad

Un proceso de POISSON está caracterizado por un parámetro fundamental, que

universalmente es designado con la letra (lambda), que es la tasa de fallas o promedio de fallas por

unidad de continuo1, es decir

(8.24) continuodeextensióndeUnidad

fallasdemedioNúmeroλ

Así, por ejemplo, podemos decir que en una tela se produce en promedio 0,8 fallas cada

100 metros o, lo que es lo mismo, 8 fallas cada 1000 metros; adviértase que la unidad en que se mide

el continuo es totalmente arbitraria.

3.1. Distribución de POISSON

Fijada la extensión t de continuo, el número r de fallas que pueden encontrarse en ella es

una variable aleatoria, denominada variable de POISSON, cuya media o esperanza matemática es

(8.25) E(r) = t

cantidad que designamos con la letra m. En el Apéndice 5.2 de este capítulo demostraremos que la

función de probabilidad de la variable r, esto es, la probabilidad de encontrar r fallas en la extensión t,

está dada por la siguiente expresión:

(8.26) !

)(r

merP

rm

(r 0)

Verifiquemos el cierre:

0

21

...!2!1

1!r

mrm

mme

r

me

La serie del último paréntesis es igual a em, con lo cual queda verificado el cierre.

1En el Capítulo 10 discutiremos con más detalle el concepto de tasa de fallas.

Page 7: MODELOS ESPECIALES DE PROBABILIDAD

7

Probaremos ahora (8.25)

1

1

00 )!1(1 )!1(!)()(E

r

rm

r

rm

r

rm

rm

r

mem

r

me

r

merrrPr

Calcularemos ahora la varianza de r. Veamos primero la esperanza de r2:

1 )!1()11(

)!1(!)(E

11

2

r

rm

r

rm

r

rm

r

mer

r

mer

r

mer

2r

1

1

2

2

11

22

)!1()!2()!1()!1()1(

r

rm

r

rm

r

rm

r

rm

mmr

mem

r

mem

r

me

r

mer

Finalmente, la varianza es

(8.27) D2(r) = E(r

2) [E(r)]

2 = m

2 + m m

2 = m

Así, pues, la varianza de la variable de POISSON coincide numéricamente con su media.

Ejemplo 2. El proceso productivo de un tipo de tela produce fallas a una tasa

=1,2fallas/100metros=0,012 y se bobina en rollos de t=80metros, entonces m=t=0,012×80= 0,96.

Definamos como rollo de primera calidad aquel que tiene 1 o ninguna falla, como de segunda calidad

el que tiene 2 fallas y de rechazo el que tiene 3 o más fallas. Calcular los porcentajes de cada una de

estas calidades.

Solución: Calculemos las probabilidades correspondientes

3676,0!1

96,0.)1(;3829,0)0(

96,096,0

e

PeP

luego P(1ªcalidad)=P(0)+P(1)= 0,3829+0,3676=0,7504, lo que quiere decir que el 75,04% de los

rollos son de 1ª calidad. La fracción de rollos de 2ª calidad se calcula como

1764,0!2

96,0.)2(

296,0

e

P

así pues, el 17,64% de los rollos son de segunda. Calcule el lector el porcentaje de rollos de rechazo.

La distribución de POISSON está tabulada y se tiene también como función de biblioteca de

diversos programas, en particular de la popular planilla EXCEL. Llamando

P(r=r) = PPo (r \ m)

P(r r) = FPo (r \ m)

P(r r) = Gpo (r \ m)

la planilla EXCEL nos provee sus valores a través de la función =POISSON (r; m; alfanum) siendo

alfanum un parámetro alfanumérico que puede tomar el valor “verdadero”, en cuyo caso nos devuelve

la FPo (r \ m) o “falso” con el que tenemos PPo (r \ m).

También hay aproximaciones de la probabilidad acumulada. La más clásica es:

(8.28)

m

mrmrFpo

5,0)\(

válida para m 10.

Muy buena precisión ofrece la siguiente (WILSON-HILFERTY, 1931):

Page 8: MODELOS ESPECIALES DE PROBABILIDAD

8

(8.29)

3/1

1)1(9

1113)\(

r

m

rrmrFpo

Ejemplo 3. El control de producción de un tipo de tela se efectúa revisando 10 rollos,

deteniendo el proceso si se encuentra más de 1 de 2ª calidad. La longitud de los rollos es 50 metros y

se consideran de 2ª calidad los que tienen 2 o más fallas. En condiciones normales de trabajo, el

proceso productivo genera fallas al azar a razón de 1 cada 200 metros en promedio. ¿Cuál es la

probabilidad de detener el proceso innecesariamente?

Solución: La detención se produce si se encuentran 2 o más rollos de segunda calidad, en

la muestra de 10, cuya probabilidad es P=Gb(2\10; p), siendo p la probabilidad de que un rollo tenga 2

o más fallas, o sea

p = Gpo[2\m=(1/200)50] = Gpo(2\m=0,25)= 1 Fpo(1\m=0,25)

= 0265,0!1

25,0

!0

25,01)25,0\1()25,0\0(1

1025,0

ePP popo

Será entonces:

P=Gb(2\10; 0,0265) = 0,0274.

Ejemplo 4. Un fabricante compró un nuevo equipo para producir cable plástico con el cual

ha conseguido disminuir el promedio de fallas, que con el viejo equipo era de 2 cada 1.000m a 1

cada 1.000 m. Le han informado que su competidor principal, que tiene un equipo igual al que él dejó

de usar, ha instalado un nuevo equipo similar al suyo; su confianza en la fuente de información es tal

que asigna una probabilidad del 60% a dicho evento. A fin de cerciorarse, decide comprar 2.000 m de

la competencia e inspeccionarlos, hallando 5 fallas. ¿Cuál es la probabilidad de que el competidor

haya instalado el nuevo equipo?

Solución: Si el competidor hubiera instalado el nuevo equipo, el número esperado de fallas

sería 2; al haber encontrado 5 fallas, la probabilidad de que lo haya instalado, debe ser menor que el

60%. Sean los sucesos:

N: El competidor instaló el nuevo equipo

V: El competidor continúa con el equipo viejo

F: En 2.000 metros se encontraron 5 fallas.

Se pide calcular

(8.30) )V\F()V()N\F()N(

)N\F()N()F\N(

PPPP

PPP

Tenemos: P(N)=0,6 y P(V)=0,4. Además

P(F\N) = Ppo[5\m=(1/1000)2000] = Ppo(5\m=2) = 0361,0!5

252

e

P(F\V) = Ppo[5\m=(2/1000)2000] = Ppo(5\m=4) = 1563,0!5

454

e

Reemplazando en (8.30), obtenemos P(N\F)=0,2573

Ejemplo 5. En un proceso de pintura se producen fallas con media 1 falla por unidad. Las

normas de control de calidad califican como defectuosa toda unidad con más de 2 fallas. De los tres

Page 9: MODELOS ESPECIALES DE PROBABILIDAD

9

inspectores, A y B aplican correctamente la norma pero C, equivocadamente, clasifica como

defectuosas las que tienen 2 o más fallas. Si de un grupo de 15 unidades, que se saben inspeccionadas

todas por el mismo inspector, hay 3 clasificadas como defectuosas, ¿cuál será la probabilidad de que

hayan sido inspeccionadas por C?

Solución: Sean los sucesos

A: Las piezas fueron inspeccionadas por A

B: Ídem por B

C: Ídem por C

X: En 15 unidades hubo 3 clasificadas como defectuosas

Se pide:

(8.31) )C\X()C()B\X()B()A\X()A(

)C\X()C()X\C(

PPPPPP

PPP

En ausencia de otra información, las probabilidades a priori son iguales, o sea P(A)=

P(B)=P(C)=1/3. La probabilidad de que una unidad sea considerada defectuosa por A o por B es

pA = pB = Gpo(3\m=1) = 0,0803

La probabilidad de que una unidad sea considerada defectuosa por C es

pC = Gpo(2\m=1) = 0,2642

Si las 15 unidades fueron revisadas por A o por B, la probabilidad de que haya 3

defectuosas en ellas es

P(X\A) = P(X\B) = Pb(3\15; pA=pB) = 0,0863

Análogamente, si las 15 unidades fueron revisadas por C, es:

P(X\C) = Pb(3\15; pC) = 0,2113

Reemplazando en (8.31), obtenemos P(C\X)=0,5504

Ejemplo 6. Una empresa de instalaciones industriales adquirió en un remate un lote de

caños de PVC de 6 m de longitud. Para realizar una estimación del costo real de estos caños, se

averigua que este lote podría provenir de alguno de dos fabricantes: el A, cuyo proceso de fabricación

continuo se sabe presenta 1 falla cada 30 metros, o el B, que con un proceso más moderno, presenta 1

falla cada 60 m. En la primera instalación de 300 m de longitud en que se instalaron estos caños, al

realizar la prueba hidráulica tuvieron que cambiar 3 caños. ¿Cuál es la probabilidad de que el lote

provenga del proveedor A?

Solución: Sean los sucesos

A: El lote proviene del proveedor A

B: Ídem del proveedor B

X: En la instalación de 300 m se tuvieron que cambiar 3 caños

Se pide:

(8.32) )B\X()B()A\X()A(

)A\X()A()X\A(

PPPP

PPP

En ausencia de otra información, es P(A)=P(B)=0,5. Si un caño tiene una o más fallas hay

que cambiarlo; si es del proveedor A, la probabilidad es

pA=Gpo(1\mA=(1/30)6) = Gpo(1\mA=0,2) = 1 e0,2

= 0,1813

Page 10: MODELOS ESPECIALES DE PROBABILIDAD

10

Si es del proveedor B, es

pB=Gpo(1\mB=(1/60)6) = Gpo(1\mB=0,1) = 1 e0,1

= 0,0952

En 300 metros hay 50 caños de 6 metros. Si son del proveedor A, la probabilidad de que

haya que cambiar 3 es

P(X\A) = Pb(3\50; pA) = 0,009657

y si son del proveedor B

P(X\B) = Pb(3\50; pB) = 0,153628

Reemplazando en (8.32) obtenemos P(A\X)=0,0591

3.2. Cálculo aproximado de la distribución Binomial

En el Capítulo 6 vimos la aproximación Normal clásica a la distribución Binomial, válida

para n grande:

(8.33)

)1(

5,0),\(

pnp

nprpnrFb

tomando como un criterio de aplicabilidad las condiciones np>10 y n(1 p)>10, lo cual implica que n

deberá ser más grande cuando más extremo sea el valor de p. Si p está muy cercano a 0 o a 1, la

aproximación Normal puede no ser válida, siendo en ese caso preferible utilizar la aproximación de

POISSON, dada por

(8.34) Fb (r \ n; p) FPo (r \ m=np) Si p 0,1

(8.34') Fb (r \ n; p) =Gb (n r \ n; 1p) GPo [n r \ m=n(1p)] Si p 0,9

Es importante destacar que la condición de n grande, indicada por muchos tratadistas, para

la validez de (8.34), no es necesaria; únicamente se requiere que p sea pequeño o grande. Para

ciertos valores de n y p, puede haber dudas sobre cuál aproximación usar, por ejemplo n=100 y p=0,1;

en este caso, si bien serían aplicables ambas, desearíamos saber cuál es la más conveniente. Para

situaciones como esta, recomendamos utilizar el criterio de uno de nosotros (O. L. M), demostrado en

su texto (1970), como sigue:

Si n n0 utilizar la aproximación Normal

Si n < n0 utilizar la aproximación de POISSON

siendo

(8.35) 3

2

0

)1(23,0

n donde =mín(p; 1p)

Así, por ejemplo, si fuera, n=100 y p=0,1, es n0=186 y al ser n<n0, deberá utilizarse la

aproximación de POISSON.

Otras buenas aproximaciones de la distribución Binomial son las debidas a M. WISE y a E.

PAULSON. Ambas tienen la misma expresión fundamental:

(8.36) Fb(r \ n, p) (z)

También, para ambas es a=nr, b=r+1

Aproximación de WISE (1960)

Page 11: MODELOS ESPECIALES DE PROBABILIDAD

11

(8.37) 3/1

2

)3/1)(1()2(3)1(

63

9

113

rn

bbrnpLn

b

bbz si n 2r+1

3/1

1

)3/1)(1()1(3)(

63

9

113

rn

aarnpLn

a

aaz si n 2r+1

Aproximación de PAULSON (1942)

(8.38) 32

11

siendo1

3

13

3

13

pa

bA

b

A

a

abA

z

3.3. Distribución Exponencial

En el proceso de POISSON, la extensión de continuo entre fallas consecutivas es también una

variable aleatoria, denominada variable Exponencial, cuya función de distribución, que vimos en el

Capítulo 6, Ejemplo 1, y demostraremos en el Apéndice 5.1 de este capítulo, es la siguiente:

(8.39) F(x) = 1 e x/µ

En (8.39), la variable x es la extensión de continuo entre fallas consecutivas de un proceso de

POISSON, siendo µ la extensión media entre fallas. También se puede poner

(8.39’) F(x) = 1 e x

donde tiene la misma interpretación que en la distribución de POISSON, o sea es la tasa de fallas

Número medio de fallas por unidad de continuo y es igual al recíproco de la distancia media entre

fallas. En efecto, supongamos nuevamente el ejemplo anterior, en que era =1,2fallas/100metros,

entonces la distancia media entre fallas será 100/1,2=83,3metros. Otro ejemplo: Si nos dicen que

recibimos una llamada telefónica cada 2 minutos (µ=2minutos=tiempo medio entre llamadas),

entonces la tasa de llamadas es = 1 llamada / 2minutos = 0,5llamada/minuto. Así pues, la media de

esta distribución es:

(8.40) λ

1

La función de densidad se obtiene de (8.39’) como

(8.41) f(x) = F ’(x) = ex

En la Fig. 8.2 vemos la representación gráfica

La varianza, que puede calcularse por definición, está dada por:

(8.42) 2

2

λ

y, entonces, el desvío estándar es igual a 1/ o sea igual a la media de la distribución.

Como hemos indicado anteriormente, la relación /µ de una variable, esto es, su coeficiente

de variación, es una indicación del grado de dispersión o de aleatoriedad que ella tiene. Así, por

ex

Fig. 8.2

Page 12: MODELOS ESPECIALES DE PROBABILIDAD

12

ejemplo, en el caso de las variables que provienen de procesos controlados, que responden, en general,

a la distribución Normal, dicha relación rara vez excede al 20%, en cambio para el caso de los

ingresos, regidos con por el modelo Lognormal, dicha relación toma valores superiores al 50% y,

frecuentemente, es mucho mayor (100% o más). En el caso de la distribución Exponencial, la relación

/µ es igual al 100%, lo cual indica que estamos frente a una variable con un alto grado de

dispersión.

Otra aplicación importante de este modelo es la siguiente: Las fallas de una pieza constituyen

un proceso de POISSON siempre que se produzcan por causas exclusivamente aleatorias, no por

desgaste ni fatiga. Son ejemplos de fallas aleatorias las de un fusible de luz o de un chip de memoria

RAM, que no disipa energía, a diferencia del procesador. En ese caso, si llamamos x a la duración de

esas piezas, será válida la expresión (8.39). Nótese que la probabilidad de que la pieza dure x o más

horas es G(x)=ex

y también es igual a la probabilidad de que en t horas tenga 0 fallas o sea

PPo(0\m=t). Nuevamente, este es un modelo analítico y esta expresión puede demostrarse a partir de

la definición del proceso de POISSON Véase la demostración en el Apéndice 5.2 de este capítulo. Se

corrobora la alta dispersión de esta variable; considérese el alto grado de incertidumbre que se tiene,

por ejemplo, frente al tiempo entre dos cortes de luz consecutivos.

Ejemplo 7. Un elemento falla “a la POISSON” con una vida media de 400 horas. a) Calcular

la duración garantizada con 90% de probabilidad. b) Si un elemento funcionó 400 horas sin fallar,

¿cuál es la probabilidad de que funcione 100 horas más?

Solución: a) La duración garantizada con 90% de probabilidad es el valor de la variable x=x0

tal que:

0,9 = P(x x0)

o sea

G(x0) = 0,9

0,9 = /0x

e

1054,09,00

Lnx

x0 = 42,1hs

b) Si un elemento ha funcionado durante 400 horas sin fallar, la probabilidad de que funcione

100 horas más es la probabilidad condicional:

/400

/500

)400(

)500(

)400(

)400()500()400\500(

e

e

xP

xP

xP

xxPxxP

= e100/400

= e 0,25

= 0,779

Observemos que esta probabilidad (e100/ µ

) es también la probabilidad incondicional de que

un elemento dure más de 100 horas. La interpretación de esto es que el elemento se mantiene siempre

nuevo, o sea, si ha funcionado x horas sin fallar, la probabilidad de que funcione otras horas es

siempre la misma, independiente de x, sólo función de y vale e /µ

. En el Apéndice 5.1 de este

capítulo se demuestra que la única distribución que tiene esta propiedad es la Exponencial, que rige la

vida de elementos que fallan por causas exclusivamente aleatorias. En cambio, para un elemento que

falla por desgaste o fatiga, la probabilidad de que falle en las próximas horas depende de las x

horas que ha estado funcionando. En el Capítulo 10 estudiaremos con detalle esta cuestión.

3.4. Distribución Gamma

Page 13: MODELOS ESPECIALES DE PROBABILIDAD

13

Otro modelo importante que aparece en el proceso de POISSON es la distribución de la

extensión de continuo necesaria para que se produzcan r fallas, o la duración total de un stock de r

elementos cuya falla individual se produce por causas aleatorias; sería una suma de r variables

Exponenciales, todas con el mismo . Se

tiene así la denominada distribución

Gamma (o de ERLANG), cuya función de

densidad es:

(8.43)

/1

)!1(

1)( x

rx e

rxf

que hemos representado en la Fig. 8.3 para

distintos valores del parámetro r y =1. Es

decir, que la variable Gamma puede

considerarse como una suma de r variables

Exponenciales independientes, todas con el

mismo =1/ por lo tanto, si llamamos ti a dichas variables Exponenciales, la Gamma puede

expresarse como:

(8.44) x = t1 + t2 + ... + tr

Entonces, teniendo en cuenta que la media y la varianza son operadores lineales con

propiedades de aditividad, o sea, que la media de una suma es igual a la suma de las medias y

análogamente con la varianza, podemos escribir:

(8.45) x = r

(8.46) x2 = r 2

Al tratarse de una suma de variables aleatorias, para valores suficientemente grandes del

parámetro r, la distribución Gamma se ha de aproximar a la Normal, como puede apreciarse en la

Fig. 8.3. En la práctica, se acepta que la Gamma puede considerarse Normal si r30; para r=30 el

coeficiente de variación es 0,18.

El modo de la variable, esto es, el valor de más alta frecuencia, se calcula derivando la

función de densidad e igualando a cero la derivada, ya que, para r>1, la curva es acampanada;

resolviendo entonces la ecuación f’(x)=0 se obtiene:

(8.47) Modo = (r1)

Es posible calcular la función de distribución de la distribución Gamma, si se dispone de una

tabla para la distribución de POISSON, pues la probabilidad acumulada izquierda de la Gamma es igual

a la acumulada derecha de POISSON, o sea:

(8.48) Fg(x \ r, ) = GPo(r \ m=x/)

que expresa la equivalencia de los sucesos "r o más fallas en la extensión x" y "x o menos extensión

para obtener r fallas". Esta relación (8.48) fue publicada por E. MOLINA en 1915, razón por la cual

suele denominarse "Relación de MOLINA".

Con la planilla EXCEL podemos calcular la función de distribución, digitando

=DISTR.GAMMA(x;r;;verdadero) que devuelve Fg(x \ r; )

Si el parámetro alfanumérico tomara el valor falso, devolvería la función de densidad.

Fig. 8.3

0

0,1

0,2

0,3

0,4

0,5

0,6

0 2 4 6 8 10

r=1

r=3

r=5

Page 14: MODELOS ESPECIALES DE PROBABILIDAD

14

Si el parámetro r es mayor o igual que 30, por lo dicho anteriormente, es posible aplicar la

aproximación Normal clásica, o sea

(8.49)

r

rxrxFg

);\(

Otras aproximaciones son:

(8.50)

142);\( r

xrxFg

(r 10) (FISHER)

(8.51)

1

9

13);\(

3/1

rr

xrrxFg

(sin restricciones) (WILSON-HILFERTY)

Análogamente, podemos calcular fractiles de la distribución Gamma, como sigue. Sea dado

tal que

(8.52) = Fg(x \ r; )

el valor de x que resuelve esta ecuación se obtiene, con la planilla EXCEL, como

=DISTR.GAMMA.INV(; r; )

Con la aproximación de WILSON-HILFERTY, el fractil x se obtiene con la expresión

(8.53)

3

ωω

39

11

r

z

rrx

Una propiedad importante de la distribución Gamma es que un cambio de escala no altera su

parámetro r, o sea, si x tiene distribución Gamma de parámetros rx y x, entonces la variable y=ax

tiene distribución Gamma de parámetros ry=rx y y=ax.

Ejemplo 8. Considere un stock de 10 elementos cuyas duraciones medias individuales son

iguales a =400horas. Vimos en el Ejemplo 7 que la duración garantizada para un elemento con 90%

de probabilidad es 42,1horas. Calcule la duración total para el stock, garantizada con 90% de

probabilidad.

Solución: Digitando en EXCEL

=DISTR.GAMMA.INV(0,1;10;400)

obtenemos el fractil x0,1=2.488,5 horas. Con la aproximación (8.53) se obtiene, reemplazando r=10,

=400 y z0,1=1,2816, el valor x0,1=2.489,6.

Quizás el lector considere este resultado como extraño: Si para un elemento se garantizan

42,1 horas, para 10 esperaríamos que se garanticen 421 horas. ¡Grave error!. El fractil 0,1 de una suma

de variables NO es igual a la suma de los fractiles 0,1 de los sumandos, así como el mínimo de una

suma no es igual a la suma de los mínimos. La explicación intuitiva es que no podemos tener tanta

mala suerte con los 10 elementos; una explicación un poco más formal es que la dispersión relativa de

la suma disminuye con el número de sumandos en proporción 1/r1/2

, y entonces los valores menos

probables de los extremos se acercan a la media al aumentar r, así como disminuye la

Page 15: MODELOS ESPECIALES DE PROBABILIDAD

15

asimetría de la variable suma, lo que nuevamente está relacionado con el Teorema Central del Límite.

La distribución Gamma tiene, como la Normal, la propiedad de aditividad siguiente: Dadas n

variables aleatorias independientes x1, x2, ..., xn, con distribuciones Gamma de parámetros r1, r2, ..., rn,

no necesariamente iguales, y 1=2=...=n=, la variable

y = x1+ x2+ ...+ xn

tiene distribución Gamma de parámetros ry=r1+r2+...+rn y igual al de los sumandos. Esta propiedad

será demostrada en el Capítulo 9.

Ejemplo 9. El control de recepción de una tela cruda consiste en revisar 5 rollos de cada lote

(muy grande) y rechazar el lote en caso de encontrar algún rollo con longitud inferior a 50 metros. Se

sabe que estos rollos tienen una longitud que ha quedado determinada por la aparición de la 2da. falla

y que el proceso genera en promedio 1 falla cada 160metros. a) Calcular el porcentaje de lotes

rechazados. b) ¿Qué longitud puede garantizarse para un rollo cualquiera con 90% de probabilidad? c)

Idem b) para un lote de 5 rollos. d) Idem b) para un lote de 100 rollos.

Solución: a) El porcentaje de lotes rechazados es la probabilidad de encontrar 1 o más

rollos con longitud inferior a 50 metros, o sea Gb(1\5;p), siendo p la probabilidad de que 1 rollo tenga

longitud inferior a 50 metros; esta probabilidad es igual a

p = Fg(50\ r=2;=160) = Gpo(2\ m=50/160) = Gpo(2\ m=0,3125)= 0,0398

entonces, la probabilidad de rechazar un lote será

P(rechazar lote) = Gb(1\5;0,0398) =1 Pb(0\5;0,0398) =

= 1 0,96025 = 0,184 = 18,4%

b) La longitud que puede garantizarse para un rollo con 90% de probabilidad es el valor de x

tal que

0,1 = Fg(x\ r=2;=160)

Digitando en EXCEL =DISTR.GAMMA.INV(0,1;2;160) se obtiene x=85,1 metros. Con la

aproximación (8.51) se obtiene 84,8 metros.

c) Para un lote de 5 rollos, la longitud total también tiene distribución Gamma, pero de r=10,

debido a la propiedad de aditividad. Digitando entonces en EXCEL =DISTR. GAMMA. INV (0,1;10;160)

se obtiene 995,4 metros. Con la aproximación (8.53) el resultado es 995,8 metros.

d) Para un lote de 100 rollos es r=200 y con EXCEL se obtiene 29.137 metros, en tanto que

con (8.53) el resultado es 29.137 metros, o sea el valor exacto.

3.5. Distribución Gamma de parámetro r no entero

Tal como hemos definido la distribución Gamma, esto es, la extensión de continuo asociada a

la obtención de r fallas en un proceso de POISSON, el parámetro r es, necesariamente, un número

entero mayor o igual que la unidad. Ello no obstante, esta distribución se ha mostrado adecuada para

ajustarse a otras variables no poissonianas, tales como

mm de lluvia caída mensualmente en un lugar

Demanda diaria de un producto

Edad de las personas de un país o de una ciudad

En estos casos, la obtención de los parámetros r y podrá realizarse mediante las expresiones

de la media y la varianza, o sea

Page 16: MODELOS ESPECIALES DE PROBABILIDAD

16

(8.45) = r

(8.46) 2 = r 2

Obtenida una cantidad de observaciones, X1, X2, ..., Xn, se calculará su media y su varianza y

luego, con la solución de (8.45) y (8.46), esto es

(8.54)

22

σ;

σ

r

calcularemos r y . Obviamente, en estos casos, el parámetro r no tendrá por qué ser un número

entero; será un número real positivo. La función de densidad se expresará ahora

(8.55)

/

1

)(

1)(

x

r

ex

rxf

Con respecto al cálculo de la probabilidad acumulada Fg(x\r;), la función del EXCEL

[=DISTR.GAMMA(x;r;;verdadero)] no requiere que r sea entero y arroja, por lo tanto, el resultado

exacto de la función, cuya expresión general es:

(8.56)

0

/

))...(2)(1()(),\(

n

nx

r

gnrrrr

x

r

ex

rxF

La relación de MOLINA (8.48) podrá utilizarse como una aproximación, pero en estos casos

será preferible la aproximación de WILSON-HILFERTY (8.51).

Ejemplo 10. La demanda diaria de nafta en una estación de servicio tiene distribución

Gamma con media 5.760 litros y desvío estándar 2.265 litros. Calcular: a) La probabilidad de que la

demanda de un día supere la media. b) La demanda superada con 90% de probabilidad.

Solución: a) Calculamos los parámetros r y con las expresiones (8.54)

467,6265.2

760.5

σ;664,890

760.5

265.2σ2222

r

La probabilidad pedida es:

P(x>\r; ) = 1 Fg(5.760\r=6,467; =890,664)

Con la planilla EXCEL, digitamos

=1DISTR.GAMMA(5.760;6,467;890,664;verdadero)

y obtenemos 0,448. Con la aproximación de WILSON-HILFERTY (8.51) tenemos

448,0552,01)13,0(119

131);\(1

3/1

rr

xrrxFg

o sea, en este caso, el valor exacto con 3 dígitos decimales.

b) Queremos calcular un valor x de la variable tal que

0,1 = Fg(x\ r; )

Page 17: MODELOS ESPECIALES DE PROBABILIDAD

17

Con la planilla EXCEL, digitamos

=DISTR.GAMMA.INV(0,1; 6,467;890,664)

y obtenemos x=3.114 litros. Con la aproximación de WILSON-HILFERTY (8.53) obtenemos

116.339

11

31,0

1,0

r

z

rrx litros

4. Distribución Beta

La distribución Beta está definida por la siguiente función de densidad:

(8.57) ),(

)1()(

11

nmB

xxxf

nm 0< x<1 ; m>0 ; n>0

cuya representación gráfica puede verse en las Figs. 8.4a 8.4b y 8.4c.

Si bien el uso de esta distribución es poco frecuente, puede ser útil para describir variables

que, por su naturaleza, tienen un dominio acotado (generalmente entre 0 y 1), como índices o

porcentajes. No obstante, si uno o ambos límites del campo de variación real de la variable está (están)

suficientemente alejados de los teóricos, suele haber otros modelos que compiten con ventaja, sobre

todo si se atiende al principio de parsimonia que, en esencia, consiste en elegir aquel modelo que

tenga el menor número posible de parámetros, descartando otros más complicados

cuando la mejora obtenida no resulta

de importancia práctica. Así, es muy probable

que, para el rendimiento de un proceso

químico, que varía habitualmente de lote a lote

entre 75% y 80%, el modelo más apropiado

sea la Normal. Por otra parte, como la Beta

tiene dos parámetros de forma, (en lugar de uno

o ninguno, como los modelos vistos hasta

aquí), puede adoptar formas muy variadas que

le permiten adaptarse a situaciones muy

diversas (Figs 8.4). Vea en el capítulo

siguiente, Sección 8, qué son parámetros de

corrimiento, de escala y de forma. Como

dijimos antes, cuando uno o ambos límites del

dominio real de la variable están alejados de

los teóricos, puede haber otros modelos más

parsimoniosos que resulten apropiados, tal es el

caso si, por ejemplo, la media toma valores

suficientemente bajos y la variable, en los

hechos, no está acotada a su derecha, como

puede verse en la Fig. 8.4c. Puede demostrarse

que, en ese caso, la Beta se aproxima a una

Gamma, la que entonces resulta un modelo

alternativo natural. De la misma manera, si en

la práctica la distribución no está acotada, ni a

izquierda ni a derecha, la Normal puede

competir con ventaja (Fig. 8.4b con m=n=5).

0

0.5

1

1.5

2

2.5

3

0 0.2 0.4 0.6 0.8 1

f(x)

x

m =2

n =1

m =1

n =3

m =1

n =2

m =1,5

n =1

Fig. 8.4a

0

0.5

1

1.5

2

2.5

0 0.2 0.4 0.6 0.8 1

f(x)

x

Fig. 8.4b

(

= 0,5)

m =

1

n =

1

m =

0,5

n = 0,5

m =

5

n =

5

m =

2

n =

2

Page 18: MODELOS ESPECIALES DE PROBABILIDAD

18

En nuestra experiencia con variables teóricamente acotadas, hemos encontrado que, casi

siempre, se dan las condiciones para adoptar modelos alternativos más parsimoniosos. No obstante,

pueden imaginarse casos, como por ejemplo el porcentaje (diario, semanal, etc.) de cielo cubierto por

nubes, en que la distribución puede tomar, según la época y el lugar,

formas muy variadas que incluyen, entre otras, la forma de U.

Un ejemplo, a nuestro juicio incorrecto, de uso de la Beta, es el

caso de los tiempos de operaciones en los diagramas de camino

crítico –P.E.R.T.–, ya que no existe demostración o análisis empírico

alguno que lo justifique, y pueden en cambio utilizarse otros

modelos, como la Normal o la Gamma. Cabe destacar que,

Kaufmann y Desbazeille (1965), aclaran que “Cuando se ignoran las

distribuciones de los tiempos operatorios se supone, en el método

P.E.R.T. y por razones de simple comodidad de cálculo, que dichos

tiempos operatorios se distribuyen según leyes Beta”.

La media y la varianza están dadas por las siguientes

expresiones

(8.58) 1

)1(σ;

2

nmnm

m

que nos permiten calcular (o estimar) m y n por momentos:

(8.59)

1

)1()1(;1

)1(

22

nm

El modo de esta variable, o sea el valor de más alta frecuencia, puede ser 0 si m<1 o 1 si n<1;

si son ambos, m y n, menores que 1, hay dos modos. Si m y n son ambos mayores que 1, el modo está

dado por la siguiente expresión:

(8.60) Modo=)1()1(

1

nm

m

El cálculo de la función de distribución se puede efectuar con los métodos para la Binomial,

mediante la siguiente relación

(8.61) FB( x\ m, n) = Gb(m\ m + n 1; p = x)

que es estrictamente válida para el caso en que m y n sean enteros positivos, pero que puede utilizarse

como una aproximación si no lo son. Una propiedad importante de la función de distribución es la

siguiente relación:

(8.62) FB( x\ m, n) = GB(1x\ n, m)

La función de distribución FB(x\m,n) se puede obtener en forma exacta con la función del

EXCEL

=DISTR.BETA(x;m;n)

cuya expresión es:

(8.63)

0

1

)1)...(2)(1(

))...(1)((1

),(

)1(),\(

i

inm

B ximmm

inmnmnm

nmmB

xxnmxF

0

1)1()1)...(2)(1(

))...(1)((1

).(

)1(1

i

inm

xinnn

inmnmnm

nmnB

xx

0

2

4

6

8

10

12

14

16

0 0.1 0.2 0.3 0.4

m =

0,5

n = 4,5

m =

10

n = 90

m =

2

n =

18

m =

1

n =

9

f(x)

x

Beta

Fig. 8.4c

= 0,1

Page 19: MODELOS ESPECIALES DE PROBABILIDAD

19

También, con EXCEL, es posible calcular fractiles x. Dado el valor de la probabilidad

acumulada izquierda, el valor de la variable asociado a dicha probabilidad, esto es x se calcula

mediante

=DISTR.BETA.INV(;m;n)

Finalmente, disponemos de las aproximaciones de WISE y de PAULSON, equivalentes a (8.37)

y (8.38), que vimos en este capítulo para la Binomial. Para ambas, la expresión es

(8.64) FB(x\ m, n) (z)

Aproximación de WISE (1960)

3/1

12

)3/1)(1()12(3)(

63

9

113

nm

nnnmxLn

n

nnz si m n

(8.65)

3/1

12

)3/1)(1()12(3)1(

63

9

113

nm

mmnmxLn

m

mmz si m n

Aproximación de PAULSON (1942)

(8.66)

3/1

)1(;

1

3

13

3

13

2

xm

nxh

n

h

m

mnh

z

Ejemplo 11. La relación entre el área cosechada y el área sembrada de trigo pan en nuestro

país, tiene distribución Beta con media 0,958 y desvío estándar 0,0278. Calcular: a) La probabilidad

de que la relación sea superior a la media. b) La relación superada el 90% de las campañas.

Solución: a) Con las expresiones (8.59) calculamos m=48,918 y n=2,145. La probabilidad

pedida es GB(0,958\m=48,918; n=2,145)=FB(0,042\m’=2,145; n’=48,918)=0,585, obtenida con la

función =DISTR.BETA(0,042;2,145;48,918) del EXCEL. Con la aproximación de PAULSON (8.66) se

obtiene 0,584.

b) La relación superada el 90% de las campañas es el fractil 0,1, que vale x0,1=0,92, obtenida

con la función =DISTR.BETA.INV(0,1; 48,918; 2,145) del EXCEL.

Relación con la distribución Gamma

En el Capítulo.... demostraremos que si x e y tienen distribuciones Gamma, independientes

entre sí, con el mismo parámetro de escala , pudiendo tener distintos parámetros de forma (rx y ry), la

relación entre una de ellas, por ejemplo x, y la suma (x+y), o sea

Page 20: MODELOS ESPECIALES DE PROBABILIDAD

20

(8.67) yx

xu

tiene distribución Beta de parámetros m=rx y n=ry.

Ejemplo 12. En un establecimiento agropecuario, distante de los centros poblados,

comenzará próximamente la cosecha de girasol, del que dispone de una importante extensión. Por

experiencia de años anteriores, el tiempo de duración de la cosecha es bastante variable, debido,

fundamentalmente, a las cambiantes condiciones climáticas de esta época del año. El análisis

estadístico de los tiempos de duración de años anteriores permite establecer que dicho tiempo tiene

distribución Gamma, con media 36 días y desvío estándar 9,8 días. Dentro de las contingencias de la

tarea, el inconveniente que se presenta con mayor frecuencia, es la rotura aleatoria de una de las

correas de trasmisión de las cosechadoras, que se produce en este establecimiento a razón de 0,2

correa/día=1 correa/5 días. Debido a la distancia del establecimiento a los centros poblados, se

desea calcular qué stock de correas habrá que prever para que la probabilidad de agotamiento del

mismo sea del 1%.

Solución: Sean las variables

x: Duración de r correas

y: Duración de la cosecha

Las variables x e y tienen, ambas, distribución Gamma. Debemos hallar el parámetro rx de la

variable x tal que

P(x<y) = 0,01

o

P(y<x) = 0,99

Sumemos en ambos miembros de la desigualdad (y<x) una variable ay de modo que esta

variable tenga el mismo parámetro de escala que x (x=5 días/correa). Deberá ser entonces x=ay o

sea a=x /y. Los parámetros de la variable y se calculan con las expresiones (8.54)

(8.54)

22

σ;

σ

r

de las que se obtiene y=2,668 y ry=13,494. Se tiene entonces a=x/y=5/2,668=1,874. Efectuando

ahora la transformación indicada:

P(y+ay<x+ay) = 0,99

99,01)1(

ayx

yaP

99,01

a

a

ayx

ayP

Como x y ay tienen el mismo parámetro de escala, la variable ay/(x+ay) tiene distribución

Beta de parámetros m=ry y n=rx. La variable x tiene parámetro de forma igual a rx, que es el stock de

correas, nuestra incógnita; la variable ay tiene parámetro de forma igual a ry=13,494. La última

expresión puede escribirse:

99,0;\1

xyB rnrm

a

aF

Page 21: MODELOS ESPECIALES DE PROBABILIDAD

21

Como es a=1,874, ry=13,494, tenemos

FB(0,652\ m=13,494; n=rx) = 0,99

Con la función =DISTR.BETA(x; m; n) de la planilla EXCEL, obtenemos

FB(0,652 \ m=13,494; n=16) = 0,984

FB(0,652 \ m=13,494; n=17) = 0,991

Por lo tanto, deberá prepararse un stock de 17 correas.

5. Apéndices

5.1. Demostración de la ley Exponencial de fallas

Veremos ahora la demostración de la expresión (8.39)

(8.39) F(x) = 1 e x/µ

donde x es la duración de un elemento que falla por causas exclusivamente aleatorias, o sea de

acuerdo con el proceso de POISSON.

Si en un momento dado, sabemos que el elemento hace x horas que funciona, la probabilidad

de que dure, a partir de ese momento, otras t horas por lo menos, es decir que dure en total (t+x) o

más horas, sabiendo que hace x horas que funciona, es:

(8.68) P[(t>t+x)\(t>x)] =

)(

)(

)(

)()(

xP

xtP

xP

xxtP

t

t

t

tt

Esta expresión es general, cualquiera sea la causa de falla del elemento.

Si el elemento falla al azar, significa que siempre está como nuevo y (8.68) debe ser igual a

P(t>t), o sea independiente del tiempo x que hace que está funcionando el elemento, es decir:

(8.69) P[(t>t+x)\(t>x)] = )()(

)(tP

xP

xtP

t

t

t (Fallas aleatorias o “a la POISSON”)

o sea

(8.69’) P(t>t+x) = P(t>t)P(t>x)

o, con nuestra notación de probabilidades acumuladas:

(8.69”) G(t+x) = G(t) G(x)

Demostraremos que el modelo Exponencial es el único que cumple con (8.69").

La derivada parcial con respecto a t del primer miembro de la expresión es:

)(

)()(.

)(

)()(

xt

xtG

t

xt

xt

xtG

t

xtG

Igualándola con la derivada parcial con respecto a t del segundo miembro, tenemos:

(8.70) )()(')(

)(xGtG

xt

xtG

Page 22: MODELOS ESPECIALES DE PROBABILIDAD

22

El mismo razonamiento sobre la variable x conduce a:

(8.70’) )(')()(

)(xGtG

xt

xtG

Las expresiones (8.70) y (8.70') tienen sus primeros miembros iguales, por lo tanto, los

segundos miembros también son iguales:

G’(t) G(x) = G(t) G’(x)

o sea

(8.71) )(

)('

)(

)('

xG

xG

tG

tG

Esta expresión (8.71) es válida para todo t y todo x, ambos reales positivos, por lo tanto, la

relación G’(t)/G(t) es una constante del proceso, negativa, porque la función G(t) es decreciente. La

llamamos . En el Capítulo 10 demostraremos que es la tasa de fallas. Tenemos entonces:

(8.72) λ)(

)('

tG

tG

Integramos ambos miembros y obtenemos

Ln G(t) = t + A

siendo A una constante de integración. Resulta finalmente:

G(t) = e t + A

La constante A es igual a cero porque G(0)=1. Esto completa la demostración.

5.2. Demostración de la función de probabilidad de POISSON

Deseamos calcular la expresión de la probabilidad de encontrar r fallas en la extensión t, o

sea la función de probabilidad de la variable r, que llamaremos P(r, t). Para ello, hacemos las

siguientes suposiciones:

Para t pequeño:

1) La probabilidad de encontrar una falla en t es proporcional a t y vale t.

2) La probabilidad de encontrar más de una falla en t es despreciable (es un infinitésimo de

orden superior).

Consideremos el tramo (t+t). La probabilidad de encontrar r fallas en (t+t), que

llamamos P(r, t+t), la podemos expresar como la probabilidad de encontrar r fallas en t y 0 fallas en

t más la probabilidad de encontrar (r1) fallas en t y 1 falla en t. Estos dos sucesos son mutuamente

excluyentes y, además, los tramos de continuo t y t son independientes o sea:

P(r, t+t) = P(r, t)P(0, t) + P(r1, t)P(1, t)

Para t pequeño (luego lo haremos tender a 0) tenemos:

P(1, t) = t ; P(0, t) = 1 t

Page 23: MODELOS ESPECIALES DE PROBABILIDAD

23

entonces:

P(r,t+t) = P(r, t)(1t) + P(r1, t) t

Después de operar, llegamos a:

),(λ),1(λ),(),(

trPtrPt

trPttrP

El límite del primer miembro, cuando t0, es la derivada de P(r,t) respecto de t, entonces:

(8.73) ),(λ),1(λ),(

trPtrPdt

trdP

Esta es una ecuación diferencial cuya función incógnita es P(r,t) y las variables

independientes son t (variable continua) y r (variable discreta). Como hay una derivada con respecto a

t y la función incógnita aparece evaluada para (r1) y r, tenemos una ecuación diferencial en

diferencias. Es decir que tenemos una sucesión de ecuaciones diferenciales, esto es, una ecuación

diferencial para cada valor de r. Para obtener la solución, comenzamos dando a r el valor r = 0, con lo

cual:

),0(λ),1(λ),0(

tPtPdt

tdP

pero obviamente P(1, t) = 0, pues no puede haber 1 falla, entonces:

),0(λ),0(

tPdt

tdP

La integral general de esta ecuación es:

P(0, t) = Ce t

La constante de integración C se obtiene con la condición P(0,0)=1, pues si t=0, con

seguridad habrá 0 fallas; tenemos entonces C =1.

A continuación, en la expresión (8.73), ponemos r=1 y obtenemos

),1(λ),0(λ),1(

tPtPdt

tdP

pero P(0, t) = et

, entonces, la solución de esta ecuación es:

P(1, t) = t et

Así siguiendo, obtenemos la solución para P(r,t):

P(r,t) = !

)(λ

r

te rt

Esta es la función de probabilidad de POISSON.