Upload
others
View
9
Download
0
Embed Size (px)
Citation preview
3. Variables aleatorias
Estadıstica
Ingenierıa Informatica
Curso 2009-2010
Estadıstica (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 1 / 33
Contenidos
1 Variables aleatorias y su distribucion
2 Transformacion de variables aleatorias
3 Medidas caracterısticas de una variable aleatoriaEsperanzaMomentos de una variable aleatoria. VarianzaOtras medidas caracterısticas
Estadıstica (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 2 / 33
Variables aleatorias y su distribucion
Si en un experimento aleatorio, a cada suceso elemental del espacio (Ω,P)le asignamos un valor numerico obtenemos una variable que “hereda” deΩ la probabilidad P, y que denominamos variable aleatoria.
La probabilidad P de que X tome un valor concreto a, P(X = a), es laprobabilidad que corresponde a la union de los sucesos aleatorioselementales a los que hemos asignado ese valor a.
Estadıstica (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 3 / 33
Variables aleatorias y su distribucion
Ejemplo 1:
Experimento aleatorio: “lanzar un dado”.
v.a. mas natural X : asignar a cada cara del dado su valor numerico ⇒X toma seis valores, del 1 al 6, con probabilidad
P(X = a) =1
6, a = 1, ..., 6
v.a. (no tan natural) Y : asignar el valor 1 a las caras que sonmultiplos de tres y el valor 0 a las que no lo son,
Y =
1, con probabilidad p = 1
30, con probabilidad p = 2
3
Estadıstica (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 4 / 33
Variables aleatorias y su distribucion
Ejemplo 2:
Vamos a realizar un experimento aleatorio que consiste en“seleccionar una persona al azar”. Para cada persona observamos elnumero de hermanos que tiene y su peso.
Podemos usar las v.a.’s:- X para el numero de hermanos, cuyos valores seran numeros enteros apartir de cero,- Y para el peso; con rango de valores todos los posibles entre los lımitesnaturales; entre dos valores posibles de Y se podrıan obtener infinitosvalores intermedios (si utilizaramos aparatos con suficiente precision).
Estos infinitos valores en el rango de la variable es lo que diferencia a lasvariables continuas (Y ) de las discretas (X ).
Estadıstica (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 5 / 33
Variables aleatorias y su distribucion
Definicion:
Una variable aleatoria X es una funcion X : Ω→ R, que a cada elementodel espacio muestral le hace corresponder un numero real.
El conjunto de valores reales que tienen asociado algun elemento delespacio muestral se denomina rango de la v.a.:
ΩX = x ∈ R : ∃s ∈ Ω,X (s) = x
Si ΩX es un conjunto finito o numerable, entonces la variablealeatoria se denomina discreta.
En caso de que ΩX sea un intervalo, finito o infinito, entonces lavariable aleatoria se denomina continua.
Estadıstica (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 6 / 33
Variables aleatorias y su distribucion
¿Como asignamos una probabilidad P a los valores del rango de una v.a.?
(¿como hereda la variable X la funcion de probabilidad P del espacio Ω?)
Dado A ⊂ R, la probabilidad de A viene dada por
P(A) = P(X ∈ A) = P(s ∈ Ω : X (s) ∈ A)
La funcion de
masa (v.a. discreta)densidad (v.a. continua)
caracteriza P (inducida por P)
¿que significa? que conocida la funcion de masa/densidad de X podemoscalcular la probabilidad de cualquier subconjunto A ⊂ R
¿por que usarlas? porque son mas faciles de calcular y de manipular
Estadıstica (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 7 / 33
Variables aleatorias y su distribucion
Funcion de masa (v.a.discreta)
Es una funcion que representa la probabilidad de que X tome cada uno delos posibles valores (discretos) xi , i = 1, ..., n, ...:
p : R → [0, 1]xi → p(xi ) = P(X = xi ) =
= P(s ∈ Ω : X (s) = xi )
Propiedades:
1. 0 ≤ p(x) ≤ 1, ∀x ∈ R2.∑
i
p(xi ) = 1
3. Dado A ⊂ R, P(X ∈ A) =∑xi∈A
p(xi )
Estadıstica (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 8 / 33
Variables aleatorias y su distribucion
Funcion de densidad (v.a.continua)
Es una funcion f : R→ R que describe la probabilidad de X de lasiguiente manera: si tenemos un subconjunto de numeros reales A ⊂ R, laprobabilidad de que la variable aleatoria continua X tome un valor en
dicho conjunto es P(X ∈ A) =
∫A
f (x)dx .
No hay que confundir la probabilidad P(X = a) con el valor de la funcionde densidad en a, f (a)
Propiedades:
1. f (x) ≥ 0, ∀x ∈ R,
2.
∫R
f (x)dx = 1.
Estadıstica (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 9 / 33
Variables aleatorias y su distribucion
Como consecuencia:
P(a ≤ X ≤ b) =
∫ b
af (x)dx
P(X = a) =
∫a
f (x)dx =
∫ a
af (x)dx = 0
la probabilidad de que una v.a. continua X tome un valor a es cero
P(X ≤ a) = P(X < a)
P(X ≥ a) = P(X > a)
Estadıstica (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 10 / 33
Variables aleatorias y su distribucion
Funcion de distribucion
Otra funcion F que caracteriza la funcion de probabilidad P de una v.a.X :
F (x) = P(−∞, x ] = P(s ∈ Ω : X (s) ≤ x), ∀x ∈ R
Propiedades:
1. lımx→−∞
F (x) = 0
2. lımx→∞
F (x) = 1
3. x1 < x2 ⇒ F (x1) ≤ F (x2) (monotona no decreciente)
4. F (x+) = lımh→0+
F (x + h) = F (x) (continua por la derecha)
Estadıstica (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 11 / 33
Variables aleatorias y su distribucion
Como consecuencia:
P(a, b] = P(−∞, b]− P(−∞, a] = F (b)− F (a)
P(a, b) = P(−∞, b)− P(−∞, a] = F (b−)− F (a)
P[a, b] = P(−∞, b]− P(−∞, a) = F (b)− F (a−)
P[a, b) = P(−∞, b)− P(−∞, a) = F (b−)− F (a−)
Pa = P(−∞, a]− P(−∞, a) = F (a)− F (a−) (salto de probabilidaden a)
donde P(−∞, a) = F (a−)
Si F tiene un salto en un punto a entonces P(a) > 0
Estadıstica (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 12 / 33
Variables aleatorias y su distribucion
Funcion de distribucion de una v.a.discreta
F (x) =∑xi≤x
P(X = xi ) =∑xi≤x
p(xi )
es una funcion continua a trozos (funcion en escalera)
Funcion de distribucion de una v.a.continua
F (x) =
∫ x
−∞f (t)dt
F es continua: no tiene saltos (todos los conjuntos formados por unsolo punto tienen probabilidad cero)
Calculamos f (x) a partir de F (x) derivando: f (x) =dF (x)
dx
Estadıstica (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 13 / 33
Variables aleatorias y su distribucion
Ejemplo 1:
Experimento aleatorio: lanzar cuatro veces una moneda equilibrada.Espacio muestral:Ω = CCCC ,CCC +,CC + C ,C + CC ,+CCC ,CC + +,C + C +,C ++C ,+CC +,+C +C ,++CC ,+++C ,++C +,+C ++,C +++,++++X v.a. que expresa el numero de cruces obtenidas; toma el valor 0 cuandoel resultado es CCCC, el valor 1 si ocurre el suceso CCC +, CC + C ,C + CC , +CCC, el valor 2 si aparece CC + +, C + C +, C + +C ,+CC +, +C + C , + + CC, el valor 3 para los resultados + + +C ,+ + C +, +C + +, C + ++, y el valor 4 si sale + + ++.
P(xi ) =
116 xi = 04
16 xi = 16
16 xi = 24
16 xi = 31
16 xi = 4
F (x) =
0 x < 01
16 0 ≤ x < 15
16 1 ≤ x < 21116 2 ≤ x < 31516 3 ≤ x < 4
1616 = 1 x ≥ 4
Estadıstica (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 14 / 33
Variables aleatorias y su distribucion
Ejemplo 1 (cont.):
Se quiere hallar la probabilidad de que aparezcan mas de dos cruces:
P(X > 2) = P(X = 3) + P(X = 4) =4
16+
1
16=
5
16
o tambien:
P(X > 2) = 1− P(X ≤ 2) = 1− F (2) =5
16
Se quiere calcular la probabilidad de que el numero de cruces seamas de 1 y menos de 4:
P1 < X < 4 = P(X = 2) + P(X = 3) =4
16+
6
16=
10
16
Estadıstica (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 15 / 33
Variables aleatorias y su distribucion
Ejemplo 2:
Sea X una variable aleatoria continua, caracterizada por la siguientefuncion de densidad:
f (x) =
k(x2 + 1) si 0 < x < 30 en el resto
Para que sea funcion de densidad, la integral en R debe ser 1:
1 =
∫R
f (x)dx =
∫ 3
0k(x2 + 1)dx =
(k
x3
3+ kx
)∣∣∣∣30
= k33
3+ 3k =
= 9k + 3k = 12k ⇒ k =1
12
Funcion de distribucion:
F (x) =
0, x < 0∫ x
0k(t2 + 1)dt, 0 ≤ x ≤ 3
1, x > 3
=
0, x < 0
x3 + 3x
36, 0 ≤ x ≤ 3
1, x > 3
Estadıstica (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 16 / 33
Transformacion de variables aleatorias
Transformacion de variables aleatorias
Dadas una variable aleatoria X y una funcion real de variable realg : R→ R queremos estudiar la distribucion de la variable aleatoriatransformada por g de X , Y = g(X )
Basta con calcular la funcion de distribucion de Y (P esta caracterizadapor F )
FY (y) = PY (Y ≤ y) = PY (g(X ) ≤ y) = PX (X ∈ Ay ),
donde Ay = x : g(x) ≤ y (en muchos casos es sencillo de calcular)
Estadıstica (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 17 / 33
Transformacion de variables aleatorias
Transformacion de una v.a.discreta
Funcion de distribucion:
FY (y) = PX (X ∈ Ay ) =∑
xi∈Ay
pX (xi ) =∑
g(xi )≤y
pX (xi )
Funcion de masa:
pY (y) = PY (Y = y) = PY (g(X ) = y) =∑
g(xi )=y
pX (xi )
Transformacion de una v.a.continua
Funcion de distribucion (g continua y creciente):
FY (y) = PY (g(X ) ≤ y) = PX (X ≤ g−1(y)) = FX (g−1(y))
Funcion de densidad (g derivable e inyectiva):
fY (y) = fX (x)
∣∣∣∣dx
dy
∣∣∣∣Estadıstica (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 18 / 33
Transformacion de variables aleatorias
Ejemplo:
Dadas la variable aleatoria continua X , con funcion de densidadfX (x) = 2x , 0 < x < 1, y la funcion continua g(x) = 3x + 1, calcularla funcion de densidad de la variable aleatoria continua Y = g(X ).
Como x = g−1(y) =y − 1
3,
y
∣∣∣∣dx
dy
∣∣∣∣ =
∣∣∣∣13∣∣∣∣ =
1
3, sera:
fY (y) = 13 fX ( y−1
3 ) = 2y−29 ,
(1 < y < 4)
Estadıstica (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 19 / 33
Transformacion de variables aleatorias
Ejemplo (cont.):
Alternativamente, podemos calcular fY de la siguiente manera:Funcion de distribucion de Y :
FY (y) = P(Y ≤ y) = P(g(X ) ≤ y) = P(X ≤ g−1(y)
)= FX
(g−1(y)
)=
=
∫ y−13
02tdt = t2
∣∣ y−13
0=
(y − 1)2
9,
y derivamos FY para obtener la funcion de densidad:
fY (y) =2(y − 1)
9=
2y − 2
9
Estadıstica (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 20 / 33
Medidas caracterısticas de una variable aleatoria
Medidas caracterısticas de una v.a.
El estudio y comparacion de la distribucion de probabilidad de distintasvariables aleatorias es mas sencillo mediante el uso de constantes(medidas caracterısticas de la variable) que caracterizan
la tendencia central de las distribuciones (o valor central alrededor delcual se encuentran repartidas de forma equilibrada las probabilidades),
la dispersion (mayor o menor densidad en torno al valor central),
etc.
Estadıstica (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 21 / 33
Medidas caracterısticas de una variable aleatoria Esperanza
Esperanza (I)
medida caracterıstica de tendencia central mas importante
tambien se denomina “esperanza matematica”, “media” o “valoresperado” de la v.a.
se denota como E [X ] o µX
representa el valor promedio o centro de gravedad de los valores quetoma la variable, ponderando estos mediante la correspondienteprobabilidad.
Estadıstica (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 22 / 33
Medidas caracterısticas de una variable aleatoria Esperanza
Esperanza (II)
Esperanza de una v.a.discreta
µX = E [X ] =∑
i
xipX (xi )
Dada g : R→ R, la esperanza de Y = g(X ), viene dada por
µY = E [Y ] =∑
i
g(xi )pX (xi )
Esperanza de una v.a.continua
µX = E [X ] =
∫R
xfX (x)dx
Dada g : R→ R, la esperanza de Y = g(X ), viene dada por
µY = E [Y ] =
∫R
g(x)fX (x)dx
Estadıstica (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 23 / 33
Medidas caracterısticas de una variable aleatoria Esperanza
Esperanza (III)
Propiedades:
Dadas las variables aleatorias X ,Y y dos numeros reales a, b ∈ R, se tiene:
E [aX + b] = aE [X ] + b
E [X + Y ] = E [X ] + E [Y ](es un operador lineal)
Estadıstica (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 24 / 33
Medidas caracterısticas de una variable aleatoria Momentos de una variable aleatoria. Varianza
Momentos
valores esperados de ciertas funciones de X
se pueden definir alrededor de cualquier punto de referenciaI alrededor del cero ⇒ momentos ordinarios o respecto al origenI alrededor de la esperanza de X ⇒ momentos centrales o respecto a la
media
Momento ordinario de orden k: αk = E [X k ]
α1 = µX (el momento ordinario de orden 1 es la media de X )
Momento central de orden k: µk = E [(X − µX )k ]
µ1 = E [X − µX ] = E [X ]− µX = µX − µX = 0 (el momento central deorden 1 de cualquier v.a. es cero)
Dos v.a. con los mismos momentos tienen la misma distribucion deprobabilidad (los momentos caracterizan la distribucion de probabilidad)
Estadıstica (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 25 / 33
Medidas caracterısticas de una variable aleatoria Momentos de una variable aleatoria. Varianza
Varianza (I)
momento central de orden 2: µ2 = E [(X − µX )2]
se denota por V (X ) o σ2X
representa la distancia cuadratica promedio a la media ⇒ dispersionde una v.a. en torno a su media
su raız cuadrada, σ, se denomina desviacion tıpica
E [(X − µX )2] = E [X 2]− µ2X
(el momento central de orden 2 es igual al momento ordinario de orden 2menos el cuadrado del momento ordinario de orden 1)
Estadıstica (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 26 / 33
Medidas caracterısticas de una variable aleatoria Momentos de una variable aleatoria. Varianza
Varianza (II)
Varianza de una v.a.discreta
σ2X = V (X ) = E [(X − µX )2] =
∑i
(xi − µX )2pX (xi )
o alternativamente:
σ2X = E [X 2]− µ2
X =∑
i
x2i pX (xi )− µ2
X
Varianza de una v.a.continua
σ2X = V (X ) = E [(X − µX )2] =
∫R
(x − µX )2 fX (x)dx
o alternativamente:
σ2X = E [X 2]− µ2
X =
∫R
x2 fX (x) dx − µ2X
Estadıstica (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 27 / 33
Medidas caracterısticas de una variable aleatoria Momentos de una variable aleatoria. Varianza
Varianza (III)
Propiedades:
Dada una variable aleatoria X y dos numeros reales a, b ∈ R, se verifica:
V (X ) = E [X 2]− (E [X ])2
V (aX ) = a2V (X )
V (b) = 0
V (aX + b) = a2V (X )
Desigualdad de Chebichev:
P(|X − µX | > kσX ) ≤ 1
k2
Estadıstica (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 28 / 33
Medidas caracterısticas de una variable aleatoria Otras medidas caracterısticas
Mediana (I)
Mediana de una v.a. X
Es el valor Me tal que
P(X < Me) ≤ 1
2, y F (Me) = P(X ≤ Me) ≥ 1
2
es una medida de tendencia central en el sentido de que es el valorpara el cual la distribucion de probabilidad queda dividida en dospartes iguales
Estadıstica (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 29 / 33
Medidas caracterısticas de una variable aleatoria Otras medidas caracterısticas
Mediana (II)
Mediana de una v.a.discreta
es el primer valor (o rango de valores) que acumula (por la izquierda) una
probabilidad mayor o igual a1
2
Mediana de una v.a.continua
es el valor que verifica F (Me) =1
2
Estadıstica (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 30 / 33
Medidas caracterısticas de una variable aleatoria Otras medidas caracterısticas
Coeficiente de variacion
CVX = σXµX
expresa la magnitud de la dispersion de una variable aleatoria conrespecto a su valor esperado
permite comparar la dispersion relativa de dos distribuciones deprobabilidad
especialmente util cuando la escala de medida de las variables quequeremos comparar difiere notablemente
Estadıstica (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 31 / 33
Medidas caracterısticas de una variable aleatoria Otras medidas caracterısticas
Ejemplo:
Sea la variable aleatoria discreta X correspondiente al numero decruces obtenidas al lanzar 4 veces una moneda
Funcion de masa: P(xi ) =
116 xi = 04
16 xi = 16
16 xi = 24
16 xi = 31
16 xi = 4
Media: µX = 0 · 1
16+ 1 · 4
16+ 2 · 6
16+ 3 · 4
16+ 4 · 1
16= 2
La funcion de distribucion a la izquierda de 2 es5
16y en 2 es
11
16⇒
Me =2.
Varianza: σ2X = 02 · 1
16+ 12 · 4
16+ 22 · 6
16+ 32 · 4
16+ 42 · 1
16− 22 =
16
16= 1
Coeficiente de variacion: CVX =
√1
2=
1
2
Estadıstica (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 32 / 33
Medidas caracterısticas de una variable aleatoria Otras medidas caracterısticas
Ejemplo:
Sea la variable aleatoria continua X , con funcion de densidadfX (x) = 2x , si 0 < x < 1.
Media: µX =
∫ 1
0x · 2xdx =
2x3
3
∣∣∣∣10
=2
3= 0,67
La mediana sera el valor Me tal que1
2=
∫ Me
02xdx = x2
∣∣Me
0= Me2,
luego Me =
√1
2= 0,71
Momento ordinario de orden 2: E [X 2] =
∫ 1
0x2 · 2xdx =
2x4
4
∣∣∣∣10
=1
2
⇒ σ2X =
1
2−(
2
3
)2
=1
18= 0,05
Coeficiente de variacion: CVX =
√1
18
23
=1
2√
2=
√2
4
Estadıstica (Aurora Torrente) 3. Variables aleatorias Curso 2009-2010 33 / 33