24
M M M A A A T T T E E E M M M Á Á Á T T T I I I C C C A A A S S S Y Y Y E E E S S S T T T A A A D D D Í Í Í S S S T T T I I I C C C A A A I I I Beatriz Rodríguez Moreiras Curso 2014 -15

Tema 6. variables aleatorias y distribuciones de probabilidad

Embed Size (px)

Citation preview

Page 1: Tema 6. variables aleatorias y distribuciones de probabilidad

MMMAAATTTEEEMMMÁÁÁTTTIIICCCAAASSS YYY EEESSSTTTAAADDDÍÍÍSSSTTTIIICCCAAA III

Beatriz Rodríguez Moreiras

Curso 2014 -15

Page 2: Tema 6. variables aleatorias y distribuciones de probabilidad

2

TEMA 6. VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

1. Sentido del tema

– Conocer y comprender el concepto de variable aleatoria, sus tipos y características. – Conocer y aprender a trabajar con modelos regidos por distintas distribuciones de probabilidad, en especial con la distribución Normal en sus diferentes aplicaciones: lecturas de análisis clínicos, puntos de corte en el diagnóstico de una enfermedad,… 2. Epígrafes del tema.

6.1 Concepto de variable aleatoria. Clases de variables aleatorias 6.2 Distribuciones de probabilidad discretas: Función masa de probabilidad. Función de distribución. Esperanza. Varianza 6.3 Distribución Binomial 6.4 Distribución de Poisson 6.5 Distribuciones de probabilidad continuas: Función de densidad. Función de distribución. Esperanza. Varianza 6.6 La distribución Normal. Tipificación de una variable. Aproximación a la Normal de una variable Binomial 6.7 Distribuciones asociadas a la normal: la distribución “t de Student”, la distribución “chi-cuadrado de Pearson”, la distribución “F de Fisher-Snedecor” 3. Contenidos del tema.

VARIABLES DISCRETAS Y CONTINUAS Definición. Una variable aleatoria X es una aplicación X :Ω⎯ →⎯ , siendo Ω el conjunto de todos los posibles resultados del experimento aleatorio, es decir, el suceso seguro. Ejemplo: Sea el experimento aleatorio consistente en lanzar tres monedas, y definimos, por ejemplo, la variable aleatoria “X = número de caras que se obtienen al lanzar las tres monedas, n = 3” Todos los posibles resultados del experimento se pueden calcular de forma sencilla haciendo un diagrama de árbol, (con C indicamos cara y con + cruz) La aplicación resulta entonces:

X :Ω ⎯ →⎯⎯⎯⎯⎯

CCC ⎯ →⎯⎯⎯ X (CCC) = 3

CC + ⎯ →⎯⎯ X (CC+) = 2

C +C ⎯ →⎯⎯ X (C +C) = 2

+CC ⎯ →⎯⎯ X (+CC) = 2

C + + ⎯ →⎯⎯ X (C + +) = 1

+C + ⎯ →⎯⎯ X (+C+) = 1

++C ⎯ →⎯⎯ X (+ +C) = 1

+ + + ⎯ →⎯⎯ X (+ + +) = 0

Page 3: Tema 6. variables aleatorias y distribuciones de probabilidad

3

La imagen de la aplicación X, es el conjunto de los valores que toma la función, es decir,

ImX = 0, 1, 2, 3{ } , que abreviadamente también se puede escribir

X = 0, 1, 2, 3{ } , con lo que estaríamos

indicando que todos los posibles valores que puede tomar la variable aleatoria X = número de caras que se obtienen al lanzar las tres monedas, son “0 (no sale ninguna cara), 1 (sale una cara), 2 (salen dos caras) y 3 (salen tres caras). Como vemos en la definición siguiente, X es una variable aleatoria discreta (solo toma un número finito de valores) Definición. Una variable aleatoria X es discreta si Im X es un subconjunto de finito o infinito numerable (el conjunto de los números enteros ). Es decir, X puede tomar un número finito, o infinito numerable de valores puntuales posibles. Ejemplo 1. La variable Y: número de pérdidas de petróleo que afectan por año a las aguas costeras de una región. Se trata de una variable aleatoria, no toma exactamente el mismo valor cada año. Puede variar enormemente de año en año, y su variación es debida al azar. Si en un año determinado hay 5 pérdidas escribiremos y=5. La variable Y es discreta , dado que el número de valores posibles para Y es finito. Los valores pueden razonablemente variar desde 0 hasta, quizás, 50, un conjunto finito de números. Ejemplo 2. La variable B: número de niños nacidos en una maternidad concreta antes del nacimiento de los primeros gemelos siameses. B es discreta puede tomar los valores {0,1,2,3, ...}, es un conjunto infinito numerable. (No puede establecerse firmemente un límite superior para el conjunto de los posibles valores). Definición. Una variable aleatoria X es continua si Im X es un subconjunto de infinito no numerable. Es decir, X puede tomar cualquier valor en algún intervalo (o intervalos) del conjunto de los números reales (toma valores infinitos no numerables) y la probabilidad de que tome uno determinado es 0. Ejemplo 1. Sea X el número de cm3 de un fármaco que debe prescribirse a un paciente para controlar ataques epilépticos. La cantidad de fármaco no se restringe a cualquier colección finita de posibles valores prefijados. Puede tomar cualquier valor entre 0 y, por ejemplo, 0´5 cm3. Es decir, los posibles valores de X están en el intervalo [0, 0´5]. X es variable aleatoria continua . Ejemplo 2. La variable D: diámetro del cuerpo de un pulpo adulto. Supongamos que está situado dentro de unos límites razonables, entre 10 y 30 cm. Los valores de D están en el intervalo [10, 30]. Si nos preguntamos antes de que la selección se haya hecho: ¿Cuál es la probabilidad de que un determinado pulpo tenga un diámetro corporal de exactamente 12´98132106 cm?

Tendremos: P(D = 12´98132106) = 0. Es virtualmente imposible encontrar un pulpo con precisamente ese diámetro sin la más mínima oscilación. (Se verá desde un punto de vista matemático en el siguiente tema).

FUNCIONES DE DENSIDAD DISCRETA Y DE DISTRIBUCIÓN Cuando estamos tratando con una variable, no basta con considerar que es aleatoria. Necesitamos ser capaces de predecir, en algún sentido, el valor que la variable adoptará en cualquier momento. Puesto que el comportamiento de una variable aleatoria está gobernado por el azar, las predicciones deberán hacerse de cara a un serio tratamiento de la incertidumbre. Lo más conveniente es describir el comportamiento de la variable en términos de probabilidades. Se utilizan dos funciones para llevarlo a cabo: la FUNCIÓN DE DENSIDAD y la FUNCIÓN DE DISTRIBUCIÓN (ACUMULATIVA). “La función de densidad, para una variable aleatoria discreta, nos da la probabilidad de que la variable adopte un valor numérico x determinado; la distribución acumulativa proporciona la probabilidad de tomar un valor por debajo de x, incluyendo a éste”.

Definición. Sea X una variable aleatoria discreta que toma los valores {x1, x2, …, xn}. La función de densidad o función de masa de probabilidad de X se define como una función

f :⎯ →⎯ 0,1⎡⎣ ⎤⎦ x → f (x) = P X = x⎡⎣ ⎤⎦

Page 4: Tema 6. variables aleatorias y distribuciones de probabilidad

4

verificando las propiedades: (a) f(x) ≥ 0 ∀x∈ (f es siempre positiva)

(b) Si sumamos f sobre todos los valores físicos posibles de X, la suma deberá ser 1. Es decir:

f (x)

∀x∈∑ = 1= P X = xi( )

∀xi

Para todos los valores reales de x que son físicamente imposibles, f(x)=0. "Cualquier función que es no-negativa y toma el valor 1 cuando se suma sobre su conjunto de valores posibles, puede considerarse como la densidad para una variable aleatoria discreta" La función de densidad es la contrapartida teórica de la frecuencia relativa. La podemos tabular:

X = xi x1 x2 … xn

f(xi) = P(X = xi) f(x1) f(x2) … f(xn) f (xi ) = P(X = xi ) = 1∑∑

Se puede representar gráficamente mediante un diagrama de barras. Ejemplo. Calcular la función de densidad para la variable aleatoria X = número de caras en el lanzamiento de 3 monedas. Recordemos que X podía tomar los valores 0, 1, 2 y 3. Tabulamos la función de densidad

Ya que, calculando:

f (0) = P(X = 0) = P + + +{ }( ) = 1 8

f (1) = P(X = 1) = P C + +{ }∪ +C +{ }∪ + +C{ }( ) = 3 8

f (2) = P(X = 2) = P CC +{ }∪ C +C{ }∪ +CC{ }( ) = 3 8

f (3) = P(X = 3) = P CCC{ }( ) = 1 8

y se comprueba que la suma de las probabilidades de que la variable tome todos los valores es igual a 1. Cuando se escribe, por ejemplo, P(X = 2) quiere decirse: “probabilidad de que salgan dos caras en el lanzamiento de tres monedas”, y las probabilidades se calculan de forma inmediata como el cociente del número de casos favorables entre el número de casos posibles. Observar que la propiedad (b) también nos dice que para todos los valores reales de x que son físicamente imposibles, entonces f(x) = 0. Esto significa que si escribimos, por ejemplo, P(X = 1/2) o P(X = –5), estaríamos preguntándonos la probabilidad de que salgan media cara o menos cinco caras en el lanzamiento de las tres monedas, sería un suceso imposible, y por tanto su probabilidad sería cero, P(X = 1/2) = P(X = –5) = 0. Por último representamos gráficamente con el diagrama de barras la función de densidad

X = xi 0 1 2 3

f(xi) = P(X = xi) 1/8 3/8 3/8 1/8

f (xi ) = P(X = xi ) = 1∑∑

Page 5: Tema 6. variables aleatorias y distribuciones de probabilidad

5

LA FUNCIÓN DE DISTRIBUCIÓN ACUMULATIVA

La segunda función que utilizaremos en el cálculo de probabilidades es la función de distribución acumulativa F. Esta es la contrapartida teórica de la distribución de frecuencias relativas acumuladas. En el caso discreto, podemos hallarla sumando los valores de la tabla de densidades. Definición. Sea X una variable aleatoria con densidad f(x). La función de distribución acumulativa de X, denotada por F, la definimos como

F : ⎯ →⎯ 0,1⎡⎣ ⎤⎦ x → F(x) = P X ≤ x( )

Tomemos un valor real concreto x0. En el caso discreto, hallamos:

P X ≤ x0( ) = F(x0 ) = P X = x( ) = f (x)

x≤x0

∑ x≤x0

Ejemplo. Calcular la función de distribución para la variable anterior X = número de caras en el lanzamiento de 3 monedas y representarla gráficamente. ya que por la definición,

F(0) = P(X ≤ 0) = P(X = 0) = 1 8F(1) = P(X ≤1) = P(X = 0) + P(X = 1) = 1 8 + 3 8 = 4 8F(2) = P(X ≤ 2) = P(X = 0) + P(X = 1) + P(X = 2) = 1 8 + 3 8 + 3 8 = 7 8F(3) = P(X ≤ 3) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) = 1 8 + 3 8 + 3 8 +1 8 = 1

Cuando se escribe, por ejemplo, P(X ≤ 2) quiere decirse: “probabilidad de que salgan al menos dos caras (o dos caras o menos) en el lanzamiento de tres monedas” También se puede escribir así

F(x) =

0, x < 01 8, 0 ≤ x <14 8, 1≤ x < 27 8, 2 ≤ x < 31, x ≥ 3

⎪⎪⎪

⎪⎪⎪

Dada la función de densidad f(x) se puede conocer la de distribución F(x), ya que habíamos definido

P X ≤ x0( ) = F(x0 ) = P X = x( ) = f (x)

x≤x0

∑ x≤x0

También se verifica que, si se conoce la función de distribución F(x) se puede definir a partir de ella la función de densidad f(x), lo vemos de forma inmediata con el ejemplo del lanzamiento de las tres monedas. Ejemplo. Se conoce la función de distribución para la variable X = número de caras en el lanzamiento de 3 monedas Calcular, a partir de ella, la función de densidad de X.

f (0) = P(X = 0) = P(X ≤ 0) = F(0) = 1 8f (1) = P(X = 1) = P(X ≤1) − P(X ≤ 0) = F(1) − F(0) = 4 8 −1 8 = 3 8f (2) = P(X = 2) = P(X ≤ 2) − P(X ≤1) = F(2) − F(1) = 7 8 − 4 8 = 3 8f (3) = P(X = 3) = P(X ≤ 3) − P(X ≤ 2) = F(3) − F(2) = 1− 7 8 = 1 8

X = x 0 1 2 3

F(x) = P(X ≤ x) 1/8 4/8 7/8 1

X = x 0 1 2 3

F(x) = P(X ≤ x) 1/8 4/8 7/8 1

X = xi 0 1 2 3

f(xi) = P(X = xi) 1/8 3/8 3/8 1/8

Page 6: Tema 6. variables aleatorias y distribuciones de probabilidad

6

En general, para cualesquiera funciones F(x) y f(x) se define:

f (xi ) = P(X = xi ) = P(X ≤ xi ) − P(X ≤ xi−1) = F(xi ) − F(xi−1) Ejercicio. Se desarrolla un compuesto para aliviar las migrañas. El fabricante afirma que es efectivo en un 90% de los casos. Se prueba sobre 4 pacientes. Sea X el número de pacientes que obtienen alivio (en una muestra de 4 pacientes).

(a) Encontrar la densidad para X, suponiendo que la afirmación del fabricante sea correcta. (b) Hallar

P X ≤1( ) e interpretar el resultado.

(c) Hallar P 0 < X ≤ 2( ) e interpretar el resultado.

(d) Hallar P X ≥ 2( ) e interpretar el resultado.

Solución.

(a) Nombramos al suceso A = un paciente obtiene alivio, su suceso contrario A = un paciente no obtiene alivio. indicando por A1, A2, A3 y A4 el primero, segundo, tercero y cuarto paciente tienen alivio, respectivamente. El conjunto de todos los posibles resultados lo podemos calcular mediante un diagrama de árbol, para llegar a obtener la fórmula general de la función de densidad y como observaremos más adelante, tener ya la definición de distribución binomial: Calculamos ahora la función de densidad

f (0) = P(X = 0) = P(A1 ∩ A2 ∩ A3 ∩ A4 ) = (0 1́)4

f (1) = P(X = 1) = P(A1 ∩ A2 ∩ A3 ∩ A4 ) + P(A1 ∩ A2 ∩ A3 ∩ A4 ) + P(A1 ∩ A2 ∩ A3 ∩ A4 ) + P(A1 ∩ A2 ∩ A3 ∩ A4 )

= 4 ⋅0´9(0 1́)3

f (2) = P(X = 2) = P(A1 ∩ A2 ∩ A3 ∩ A4 ) + P(A1 ∩ A2 ∩ A3 ∩ A4 ) + P(A1 ∩ A2 ∩ A3 ∩ A4 )

+ P(A1 ∩ A2 ∩ A3 ∩ A4 ) + P(A1 ∩ A2 ∩ A3 ∩ A4 ) + P(A1 ∩ A2 ∩ A3 ∩ A4 ) = 6 ⋅ (0´9)2 ⋅ (0 1́)2

f (3) = P(X = 3) = P(A1 ∩ A2 ∩ A3 ∩ A4 ) + P(A1 ∩ A2 ∩ A3 ∩ A4 ) + P(A1 ∩ A2 ∩ A3 ∩ A4 ) + P(A1 ∩ A2 ∩ A3 ∩ A4 )

= 4 ⋅ (0´9)3 ⋅ (0 1́)

f (4) = P(X = 4) = P(A1 ∩ A2 ∩ A3 ∩ A4 ) = (0´9)4

X = x 0 1 2 3 4

(0´1)4 4.0´9(0´1)3 6(0´9)2(0´1)2 4(0´9)30´1 (0´9)4 P(X = x)

40

⎛⎝⎜

⎞⎠⎟

(0´9)0(0´1)4

= 0´0001

41⎛⎝⎜

⎞⎠⎟

(0´9)1(0´1)3

= 0´0036

42

⎛⎝⎜

⎞⎠⎟

(0´9)2(0´1)2

= 0´0486

43

⎛⎝⎜

⎞⎠⎟

(0´9)3(0´1)1

= 0´2916

44

⎛⎝⎜

⎞⎠⎟

(0´9)4(0´1)0

= 0´6561 f (x) = 1∑

Page 7: Tema 6. variables aleatorias y distribuciones de probabilidad

7

Antes de responder a los siguientes apartados, podemos encontrar la expresión general para esta función de densidad, si tenemos en cuenta que las constantes numéricas 1, 4, 6, 4 y 1 que aparecen en las expresiones de la probabilidad son combinaciones, ya que por ejemplo, si nos piden que en 4 pacientes 3 tengan alivio, el número de veces que tendremos 3 alivios (y 1 no alivio) en 4 casos serán las combinaciones de 4 elementos tomados de tres en tres, como se puede observar en la expresión del cálculo de f(x). Entonces, por la definición del cálculo de las combinaciones de “n” elementos tomados de “r” en “r”

nr

⎛⎝⎜

⎞⎠⎟= n!

r ! n − r( )! , observamos que

40

⎛⎝⎜

⎞⎠⎟= 4!

0! 4 − 0( )! =4 ⋅3 ⋅2 ⋅1

1⋅4 ⋅3 ⋅2 ⋅1= 1

41⎛⎝⎜

⎞⎠⎟= 4!

1! 4 −1( )! =4 ⋅3 ⋅2 ⋅11⋅3 ⋅2 ⋅1

= 4

42

⎛⎝⎜

⎞⎠⎟= 4!

2! 4 − 2( )! =4 ⋅3 ⋅2 ⋅12 ⋅1⋅2 ⋅1

= 6

43

⎛⎝⎜

⎞⎠⎟= 4!

3! 4 − 3( )! =4 ⋅3 ⋅2 ⋅13 ⋅2 ⋅1⋅1

= 4

44

⎛⎝⎜

⎞⎠⎟= 4!

4! 4 − 4( )! =4 ⋅3 ⋅2 ⋅1

4 ⋅3 ⋅2 ⋅1⋅1= 1

⎪⎪⎪⎪⎪⎪⎪⎪

⎪⎪⎪⎪⎪⎪⎪⎪

Se verifica que

nr

⎛⎝⎜

⎞⎠⎟=

nn − r

⎛⎝⎜

⎞⎠⎟

La expresión para la densidad de X es f (x) =

4x

⎛⎝⎜

⎞⎠⎟

(0´9)x (0 1́)4− x, x = 0, 1, 2, 3, 4

(b)

P X ≤1( ) = P X = 0( ) + P X = 1( ) = 0´0037 “En un 0´37% de las muestras de 4 pacientes a lo sumo (como máximo) una persona nota alivio”

(c) P 0 < X ≤ 2( ) = P X = 1( ) + P X = 2( ) = 0´0522 “En un 5´22% de las muestras de 4 pacientes, notan alivio una o dos personas”

(d) P X ≥ 2( ) = P X = 2( ) + P X = 3( ) + P X = 4( ) = 0´9963 También se podría calcular pasando de la probabilidad del suceso que nos piden a la de su contrario:

P X ≥ 2( ) = 1− P X < 2( ) = 1− P X ≤1( ) = 1− 0´0037 = 0´9963 “Al menos 2 pacientes notan alivio en un 99´63% de las muestras de 4 pacientes”

ESPERANZA La función de densidad de una variable aleatoria describe totalmente su comportamiento en el sentido de una población ideal. Podemos definir unas constantes o parámetros descriptivos asociados a cualquier variable aleatoria. Si la densidad exacta de la variable es conocida, entonces a partir de ahí se pueden conocer los parámetros: la media µ , la varianza σ2 y la desviación típica σ . El conocimiento de los valores numéricos de estos parámetros permite conseguir una amplia visión de la naturaleza de las variables.

Definición. Sea X una variable aleatoria. La Esperanza de X, representada por E(X), es el promedio teórico de X a largo plazo. La media teórica de una variable aleatoria X se representa por la letra griega µ . Este valor promedio recibe también el nombre de esperanza de X, E(X). Así E(X) y µ son símbolos intercambiables para el mismo concepto. A efectos de conseguir una mayor comprensión de la esperanza, consideremos un experimento en el cual un único dado equilibrado es lanzado repetidas veces y cada vez, X, el número obtenido, queda registrado. Una secuencia típica basada en la observación, sería, por ejemplo:

2, 1, 6, 4, 2, 5, 1, 6, 3, ... Esta secuencia generará la correspondiente secuencia de medias aritméticas:

2, 2+1

2, 2+1+6

3, 2+1+6+4

4, 2+1+6+4+2

5, 2+1+6+4+2+5

6,

2 +1+ 6 + 4 + 2 + 5 +1

7, 2 +1+ 6 + 4 + 2 + 5 +1+ 6

8,... o bien 2, 1´5, 3, 3´25, 3, 3´33, 3, 3´375,...

Page 8: Tema 6. variables aleatorias y distribuciones de probabilidad

8

Estas medias son obviamente no constantes. Varían durante el experimento pero por lo general, la magnitud de los cambios disminuye a medida que se realizan más observaciones. En realidad, cuanto más aumente el número de lanzamientos del dado, la secuencia de medias tenderá a concentrarse en torno a un mismo valor numérico. Este valor es la esperanza o "media teórica a largo plazo" para X. El siguiente paso consiste en determinar estas esperanzas a partir de la densidad de X, sin tener que recurrir a la experimentación. En algunos casos, esto se puede conseguir mediante observación, como lo demuestra el siguiente ejemplo: Ejemplo. Consideremos un experimento en el cual lanzamos un dado. La variable X representa el valor obtenido en cada lanzamiento. La función de densidad para X es:

X = x 1 2 3 4 5 6 f(x) = P(X =x) 1/6 1/6 1/6 1/6 1/6 1/6

Se puede observar la simetría de la densidad. Por simple observación, la esperanza de X, E(X) = 3´5. Debemos tener en cuenta que 3´5 no es un valor de la variable X. No hay necesidad de que la esperanza de una variable aleatoria esté entre los posibles valores de X. Si la densidad no es simétrica, significa que no puede ser hallada mediante una simple observación. Se usa la definición:

Definición. Sea X una variable aleatoria discreta, con una densidad conocida f(x). Supongamos que los valores de X son x1, x2, ..., xn , con densidades conocidas

f (xi ) = P X = xi( ), i = 1, 2,...,n

X = xi x1 x2 … xi … xn f(xi) f(x1) f(x2) … f(xi) … f(xn) 1

Se define la Esperanza o valor medio o valor esperado de X

µ = E(X ) = x ⋅ f (x)

todo x∑ = x1 ⋅ f (x1) + x2 ⋅ f (x2) + ...+ xi ⋅ f (xi ) + ...+ xn ⋅ f (xn )

En el ejemplo anterior:

µ = E(X) =

x ⋅ f (x)todo x∑ = 1.1/6 + 2.1/6 + 3.1/6 + 4.1/6 + 5.1/6 + 6.1/6 = 21/6 = 3´5

En el ejercicio anterior, X = número de pacientes que obtienen alivio, en una muestra de 4 pacientes, calcular el valor esperado de pacientes que obtienen alivio,

µ = E(X ) = 0 ⋅0´0001+1⋅0´0036 + 2 ⋅0´0486 + 3 ⋅0´2916 + 4 ⋅0´6561= 3´6 Interpretamos que, para muestras de 4 pacientes se espera que obtengan alivio entre 3 y 4 pacientes. Conocida la densidad para una variable aleatoria X, podemos hallar la esperanza de funciones de X tales como X 2 y (X − µ)2 . Estas son especialmente importantes porque nos permiten calcular σ2 la varianza de X, a partir del conocimiento de la densidad. Recordemos del tema 1º, que la medida de variabilidad de la población más común es la varianza. Representábamos este parámetro mediante la letra σ2 .Su valor, como el de µ, no puede hallarse a partir de una muestra aunque pueden estimarse mediante S

2 (y x ).

Definición. Sea X una variable aleatoria discreta, con una densidad conocida f(x). Se define la Varianza de X

σ 2 =Var(X ) = E X − µ( )2⎡

⎣⎢⎤⎦⎥= x − µ( )2

todo x∑ ⋅ f (x)

Ejemplo.- Sea la densidad: x 1 2 3 f(x) 0´4 0´2 0´4

Aquí, (por observación µ = 2) µ = E(X) = 1.0´4 + 2.0´2 + 3.0´4 = 2 y de ello deducimos: σ2 = E[(X – 2)

2] = (1 – 2)

2.0´4 + (2 – 2)

2.0´2 + (3 – 2)

2.0´4 = 0´8

Hay un método simplificado para calcular la varianza:

σ 2 = E X 2( ) − E(X )( )2

= x2f (x)todo x∑ − µ2

Page 9: Tema 6. variables aleatorias y distribuciones de probabilidad

9

En el ejemplo anterior: x2 1 4 9 f(x) 0´4 0´2 0´4

E (X

2) = 1.0´4 + 4.0´2 + 9.0´4 = 4´8 ; σ2 = 4´8 – 22 = 0´8.

DESVIACIÓN TÍPICA DE X Recordemos del tema 1º, que la desviación típica es la raíz cuadrada positiva de la varianza. En el planteamiento teórico, la desviación típica σ se define como la raíz cuadrada positiva de σ2.

σ = σ 2 A la desviación típica se le puede asociar la misma magnitud física que tiene la variable aleatoria. LA DESIGUALDAD DE CHEBYSHEV Esta desigualdad nos indica otra propiedad muy útil de la desviación típica, como hemos visto en el primer tema. Dice "La probabilidad de que cualquier variable aleatoria X caiga a una distancia máxima de su media de k desviaciones típicas, es por lo menos de 1 – 1/k2". Esto es

P µ − kσ < X < µ + kσ( ) ≥1−1 k 2

Por ejemplo, si sabemos que X tiene media µ = 3, con desviación típica σ = 1, podemos llegar a la conclusión de que la probabilidad de que X caiga entre 1 y 5 es mayor o igual a 0´75, ya que: k = 2 y P(3 – 2 < X < 3 + 2) ≥ 1 – 1/4 = 0´75. Ejercicio. Se lleva a cabo un estudio comparativo de dos fármacos destinados a mantener un ritmo cardíaco constante en pacientes que han sufrido un infarto. Sean “X = número de latidos por minuto registrado mediante la utilización del fármaco A, en un paciente” “Y = número de latidos por minuto registrado mediante la utilización del fármaco B, en un paciente” Se tienen las siguientes densidades x 40 60 68 70 72 80 100 y 40 60 68 70 72 80 100 f(x) 0´01 0´04 0´05 0´8 0´05 0´04 0´01 f(y) 0´4 0´05 0´04 0´02 0´04 0´05 0´4

(a) Mediante observación, hallar el ritmo cardíaco medio para cada fármaco. ¿Existe alguna diferencia

entre los ritmos cardíacos medios provocados por los dos fármacos? (b) Mediante observación, ¿cuál de los dos fármacos provocará una variación en el ritmo cardíaco?.

Comprobar la respuesta calculando Var(X), Var(Y) y comparando los valores de estos dos parámetros.

(c) Hallar σ X , σY . ¿Qué magnitud física podemos asociar a estas desviaciones típicas? (d) Utilizando la desigualdad de Chebyshev, ¿entre qué valores oscilará el ritmo cardíaco del 75% de los

pacientes en tratamiento con el fármaco A? ¿qué valores obtendremos con el fármaco B? Solución.

(a) Las variables aleatorias X e Y son discretas.

Page 10: Tema 6. variables aleatorias y distribuciones de probabilidad

10

Observando los diagramas de barras para ambos fármacos, y debido a las simetrías de las dos distribuciones de datos, deducimos que

µA = 70 pulsaciones / minuto, µB = 70 pulsaciones / minuto . A simple vista, podemos decir que “no existe diferencia entre los ritmos cardíacos medios provocados por los fármacos A y B”

(b) También mediante observación (se ve que la mayoría de las observaciones del fármaco B están muy alejadas de la media, mientras que en el A están más concentradas en torno a la media) deducimos “que el fármaco B provoca mayor variación en el ritmo cardíaco que el A”

Si se utiliza la fórmula para la varianza,

Var(X ) = σA2 = E X 2( ) − µA

2 = 4926´4 − 4900 = 26´4

Var(Y ) = σB2 = E Y 2( ) − µB

2 = 5630´32 − 4900 = 730´32

⎫⎬⎪

⎭⎪⇒σB

2 >> σA2

(c)

σA = 5 1́3 ≅ 5 pulsaciones / minσB = 27´02 ≅ 27 pulsaciones / min

⎫⎬⎪

⎭⎪⇒σA << σB

(d)

P µA − k ⋅σA < X < µA + k ⋅σA( ) ≥ 0´75 ⇔ 1− 1k2

= 0´75 ⇒ k = 2

P 70 − 2 ⋅5 < X < 70 + 2 ⋅5( ) ≥ 0´75 ⇔ P 60 < X < 80( ) ≥ 0´75

Interpretación “Al menos el 75% de los pacientes en tratamiento con el fármaco A, tienen un ritmo cardíaco entre 60 y 80 pulsaciones/minuto” Análogamente para el B,

P µB − k ⋅σB <Y < µB + k ⋅σB( ) ≥ 0´75 ⇔ 1− 1k2

= 0´75 ⇒ k = 2

P 70 − 2 ⋅27 < X < 70 + 2 ⋅27( ) ≥ 0´75 ⇔ P 16 < X <124( ) ≥ 0´75

Interpretación “Al menos el 75% de los pacientes en tratamiento con el fármaco B, tienen un ritmo cardíaco entre 16 y 124 pulsaciones/minuto”. Concluyendo, sería mejor utilizar el fármaco A. DISTRIBUCIÓN BINOMIAL Y DE POISSON LA DISTRIBUCIÓN BINOMIAL Se estudia ahora un tipo específico de variable discreta, la variable aleatoria binomial. Las variables binomiales surgen en conexión con experimentos que superficialmente pueden parecer completamente diferentes. Observemos los siguientes experimentos:

(a) Un portador de tuberculosis tiene un 10% de posibilidades de transmitir la enfermedad a alguien que no halla estado previamente expuesto a ella y con el que entre en contacto directo. Durante el transcurso de un día, un portador entra en contacto con 20 de tales individuos. ¿Cuántos se esperaría que contrajeran la enfermedad?

(b) Se está desarrollando una nueva variedad de maíz en una extensión de experimentación agrícola. Se

espera que tenga una tasa de germinación del 90%. Para verificar esto, se plantan 20 semillas en suelos de idéntica composición y se les dedican los mismos cuidados. Si la cifra 90% es correcta, ¿cuántas semillas se esperan que germinen?, ¿qué probabilidad hay de que germinen más de 15 semillas, de esas 20?

(c) Se está llevando a cabo un estudio de opinión pública relativo a la conveniencia de la construcción de

una presa para controlar inundaciones en cierta comarca. Hay que elegir aleatoriamente y estudiar 15 residentes del área. Si resulta que un 80% de la gente que vive en el área se opone a la presa, ¿cuál es la probabilidad de que una mayoría de las personas estudiadas esté en contra? ¿Cuál es la probabilidad de que entre 10 y 14, inclusive, se opongan a la construcción?

¿Qué tienen en común estos experimentos que aparentemente no guardan relación alguna?

Page 11: Tema 6. variables aleatorias y distribuciones de probabilidad

11

Hay 4 puntos esenciales que debemos observar

(1) Se considera cada experimento como compuesto de un número fijo de pruebas idénticas "n" (a) la prueba consistiría en observar a un individuo que entre en contacto con un portador de

tuberculosis, para ver si el individuo contrae la enfermedad, n = 20. (b) la prueba consiste en la observación de una semilla de maíz para ver si germina, n = 20. (c) una prueba consistiría en determinar la opinión de un residente con respecto a la construcción

de la presa, n = 15. (2) El resultado de cada prueba puede clasificarse como "éxito" o "fracaso"

Generalmente el "éxito" se define como la constatación de la característica que se está contabilizando.

(a) éxito: un individuo contrae la enfermedad. (b) éxito: una semilla de maíz germina. (c) éxito: un residente se opone a la construcción de la presa.

(3) Las pruebas son independientes, en el sentido de que el resultado de una prueba no tiene efecto

sobre el resultado de cualquier otra y "la probabilidad de éxito =p", sigue siendo la misma de una prueba a otra.

(a) El hecho de que una persona sea susceptible de contraer la tuberculosis no tendrá influencia sobre la susceptibilidad de otra, la independencia puede ser admitida, con p = 0´1.

(b) Si suponemos que las semillas se plantan de modo que el crecimiento de una de ellas no impida el de cualquiera de las otras, las pruebas son independientes, con p = 0´9.

(c) Los sondeos de opinión suponen generalmente muestreos "sin reemplazamiento". Una vez que el individuo ha sido encuestado se le extrae de la población. De este modo, la composición de la población cambia, y la probabilidad de éxito cambia algo de prueba a prueba. En todo caso, si el grupo que está siendo muestreado es grande, como es generalmente el caso, entonces el cambio es tan insignificante como para no tenerlo en cuenta. Concluiremos que en la práctica tenemos independencia, con p = 0´8.

(4) La variable de interés, X, es el número de éxitos en "n" pruebas

Definición. Cualquier variable aleatoria X que represente el número de éxitos en "n" pruebas idénticas e independientes, con probabilidad de éxito "p" constante de una prueba a otra, se llama una variable aleatoria binomial, con parámetros n y p. X B(n, p). Definición. Sea "n" un número entero positivo. Se define:

(a) n! = n ⋅ (n −1) ⋅ (n − 2)...3 ⋅2 ⋅1 (b) 0! =1

Si se considera una secuencia de "n" objetos de los cuales "x" son de un tipo y "n – x" pertenecen a otro, el número de maneras de ordenar estos "n" objetos formando diferentes conjuntos reconocibles, son:

Cn,x =

nx

⎛⎝⎜

⎞⎠⎟= n!

x! (n - x)!

Teorema. Sea X una variable aleatoria binomial con parámetros n y p. X B(n, p) La función de densidad para X viene dada por:

f (x) = P X = x( ) = n

x⎛⎝⎜

⎞⎠⎟

px 1− p( )n−x, x = 0, 1, 2, ... ,n

La función de distribución para X viene dada por:

F(t) = P X ≤ t( ) = f (x) =

nx

⎛⎝⎜

⎞⎠⎟x=0

t

∑x=0

t

∑ px 1− p( )n−x

Dada una variable aleatoria X B(n, p), ¿cuál es el valor esperado de X? Veamos un ejemplo para orientarnos: Ejemplo. 20 individuos, cada uno de ellos propenso a la tuberculosis, entran en contacto con un portador de la enfermedad. La probabilidad de que la enfermedad se contagie del portador a un sujeto cualquiera es de 0´10. ¿Cuántos se espera que contraigan la enfermedad?

Page 12: Tema 6. variables aleatorias y distribuciones de probabilidad

12

Puesto que cada uno de los 20 individuos tiene un 10% de posibilidades de contraer la enfermedad, el sentido común nos conduce a esperar que se contagiarán un 10% de las personas expuestas. Es decir, dos personas se espera que se contagien de ese grupo de 20 individuos. Este valor se ha obtenido multiplicando el número de pruebas n = 20 por la tasa de éxitos p = 0´1. Definición. Sea X B(n, p). Entonces, las características estadísticas de la distribución binomial son:

E(X ) = npσ 2(X ) = np 1− p( )σ (X ) = np 1− p( )

⎨⎪⎪

⎩⎪⎪

Ejercicio. La aplicación de un determinado tratamiento a enfermos de cirrosis produce mejoría al 70% de los casos. Si aplicaron el tratamiento a 7 cirróticos, calcular

(a) Probabilidad de que mejoren 4 de ellos (b) Al menos 3 de ellos mejoren (c) Probabilidad de que empeoren como mucho 2 de ellos (d) ¿Cuántos enfermos cabe esperar que empeoren?

Solución. Llamamos, A = éxito: “un enfermo mejora”, p = P(A) = 0´70, constante a lo largo del experimento A = fracaso: “un enfermo empeora” 1 – p = P( A ) = 0´30. las pruebas son independientes. Definimos la variable aleatoria binomial

X = número de cirróticos que mejoran, en una muestra de 7 cirróticos, X B(n = 7,p = 0´7)

(a)

P X = 4( ) =utilizando la definición

74

⎛⎝⎜

⎞⎠⎟⋅ (0´7)4 ⋅ (0´3)3 = 0´2269

P X = 4( ) =utilizando las tablas

P X ≤ 4( ) − P X ≤ 3( ) = 0´3529 − 0 1́260 = 0´2269

“Aproximadamente, en el 22´7% de las muestras de 7 cirróticos mejoran exactamente 4” (b)

P X ≥ 3( ) = 1− P X ≤ 2( ) = 1− 0´0288 = 0´9712

“Aproximadamente, en el 97% de las muestras de 7 cirróticos al menos 3 mejoran” (c) Se puede hacer de dos formas,

(1) Una forma es definir una nueva variable binomial, donde el éxito sea ahora “un enfermo empeora” Definimos la variable aleatoria binomial

Y = número de cirróticos que empeoran, en una muestra de 7 cirróticos, Y B(n = 7,p = 0´3)

P Y ≤ 2( ) = 0´6471

(2) Otra forma es trabajar con la variable Y, transformando sus valores a los de la variable X”

P Y ≤ 2( ) = P (Y = 0)∪ (Y = 1)∪ (Y = 2)( ) = P (X = 7)∪ (X = 6)∪ (X = 5)( ) = P X ≥ 5( ) = 1− P X < 5( ) = 1− P X ≤ 4( ) = 1− 0´3529 = 0´6471

“Aproximadamente, en el 65% de las muestras de 7 cirróticos empeoran a lo sumo 2” (d) E(Y ) = n ⋅p = 7 ⋅0´3 = 2 1́

“Se espera que empeoren, aproximadamente, dos enfermos en muestras de 7 enfermos” “Se espera que mejoren 5 enfermos en muestras de 7 enfermos”

LA DISTRIBUCIÓN DE POISSON Las variables aleatorias de Poisson surgen en conexión con los llamados procesos de Poisson. Estos implican la observación de un conjunto discreto de sucesos en un "intervalo" continuo de tiempo, longitud o espacio. Al utilizar la palabra "intervalo" se entiende que (a veces) no podemos tratar con un intervalo en el sentido matemático usual. Por ejemplo

(a) Observación del número de glóbulos blancos en una gota de sangre. El suceso de interés (valor discreto) es la observación de un glóbulo blanco, mientras que "el intervalo" continuo es una gota de sangre.

Page 13: Tema 6. variables aleatorias y distribuciones de probabilidad

13

(b) Número de veces que una planta de energía nuclear emite gases radiactivos en un período de tres meses. El suceso es la emisión de gases radiactivos y el intervalo continuo de tiempo es el período de tres meses.

(c) Número de llamadas de emergencia recibidas cada noche por una brigada de rescate. El

suceso de valor discreto es la llegada de una llamada y el intervalo continuo es (por ejemplo) el intervalo de una hora.

La variable aleatoria a definir es:

X = número de sucesos en un intervalo de unidades de tamaño "s" Para hallar la densidad de X, nos plantearemos 3 preguntas

(1) ¿Cuál es la unidad de medida básica en este problema? (2) ¿Cuál es la media del número de ocurrencias del suceso por unidad? . Este valor está representado

por " λ". (3) ¿Cuál es el tamaño del intervalo de observación? . Este valor está representado por "s".

Se demuestra que la función de densidad de X viene representada por:

f (x) =

e−λs λs( )x

x!, x = 0, 1, 2, 3,... donde e = 2,7183

E(X ) = λsσ 2(X ) = λs

σ (X ) = λs

⎨⎪

⎩⎪

Una variable aleatoria cuya densidad adopta esta forma, se llama variable aleatoria de Poisson. Importante aplicación de la distribución de Poisson Sea X B(n, p) con "n" grande y "p" pequeña. En este caso, se puede demostrar que la densidad de Poisson con parámetro λ s = n p da una buena aproximación a la binomial.

X B(n, p) ⇒ X Poisson (λ s = n p) Buena aproximación cuando n ≥ 20 y p ≤ 0´05 (o mejor n ≥ 50 y p ≤ 0´1) Muy buena aproximación cuando n ≥ 100 y n p ≤ 10. Puesto que la aproximación se utiliza siempre que la probabilidad "p" de éxito es pequeña, es frecuente llamarle a la distribución de Poisson como "distribución de sucesos raros".

Recordemos que una variable aleatoria X es continua si puede tomar cualquier valor en un intervalo de números reales y además la probabilidad de que una variable aleatoria continua X tome un valor específico cualquiera es 0. Estudiamos en primer lugar la función de densidad continua y como emplearla para calcular probabilidades. Representaremos geométricamente la E(X) y consideraremos la función de distribución acumulativa F(x), también desde un punto de vista geométrico. Se estudian la familia de variables aleatorias normales, siendo éstas las de uso más frecuente dentro de las distribuciones continuas. DISTRIBUCIONES DE PROBABILIDAD CONTINUAS: FUNCIÓN DE DENSIDAD. FUNCIÓN DE DISTRIBUCIÓN. ESPERANZA. VARIANZA Recordemos que una variable aleatoria X es continua si puede tomar cualquier valor en un intervalo de números reales y además la probabilidad de que una variable aleatoria continua X tome un valor específico cualquiera es 0. Estudiamos en primer lugar la función de densidad continua y como emplearla para calcular probabilidades. Representaremos geométricamente la E(X) y consideraremos la función de distribución acumulativa, F(x), también desde un punto de vista geométrico. Se estudian la familia de variables aleatorias normales, siendo éstas las de uso más frecuente dentro de las distribuciones continuas.

Page 14: Tema 6. variables aleatorias y distribuciones de probabilidad

14

FUNCIÓN DE DENSIDAD CONTINUA

En el caso discreto las funciones de densidad se representan frecuentemente mediante tablas. La tabla nos da una lista de los posibles valores de X conjuntamente con f(x), la probabilidad de que X tome el valor x. El caso continuo es más complejo, dado que una variable aleatoria continua puede tomar infinitos valores, resulta imposible enumerarlos a todos. Además, no nos interesa una expresión que, al ser aplicada para un determinado valor de x, nos de la

P X = x( ) , ya que sabemos que si X es una variable aleatoria continua,

entonces P X = x( ) = 0 . Necesitamos una expresión de la probabilidad que nos permita conocer la probabilidad

de que X esté comprendida en un intervalo concreto o entre determinados valores.

Definición. Sea X una variable aleatoria continua. La densidad de X es una función f definida en todos los números reales, tal que,

(1) f(x) ≥ 0 , para todo x real (f es no–negativa)

(2) El área comprendida entre la gráfica de f y el eje x es 1,

f (x)dx−∞

+∞

∫ = 1

(3) Para todo a y b reales, P a ≤ X ≤ b( ) = f (x)dx

a

b

∫ es el área comprendida entre la gráfica de la función f,

las rectas x = a, x = b y el eje x. Observación. La primera labor de un científico es la de determinar la densidad adecuada a la variable aleatoria estudiada. Si ésta ha sido ya estudiada extensamente, entonces una densidad aceptable ya ha sido previamente desarrollada por otros y la podemos utilizar para contestar a nuestra investigación en particular. En cambio, si se estudia esta variable por primera vez, la densidad adecuada debe ser hallada a partir de datos experimentales. Vimos en el primer tema dos métodos para hacerlo: "el diagrama de tallo y hojas" y "el histograma". A veces el diagrama sugiere la forma de una campana, de una exponencial, etc ... Ejemplos,

P a ≤ X ≤ b( ) = f (x)dx

a

b

∫ Para calcular las áreas, tenemos que conocer la expresión exacta de la curva f, y = f(x), y emplear técnicas de cálculo de áreas. ESPERANZA

Recordemos que µ = E(X) corresponde a su promedio teórico. Excepto en los casos más fáciles, no podemos hallar la esperanza de una variable aleatoria continua sin calcularla, pero si podemos visualizar E(X) geométricamente. Tomemos la gráfica de la densidad de X. Si hacemos un corte imaginario de la región delimitada por la gráfica de f y el eje x, como si se tratara de una pieza delgada y rígida de metal e intentamos poner en equilibrio esta región sobre el filo de una cuchilla paralela al eje vertical de la gráfica, el punto en el cual la región se balancearía (punto de equilibrio) es E(X).

Definición. Sea X una variable aleatoria continua, tomando valores en todo R. Se define la Esperanza de X:

µ = E(X ) = x ⋅ f (x)dx

−∞

+∞

Page 15: Tema 6. variables aleatorias y distribuciones de probabilidad

15

Ejercicio. Supongamos que la función de densidad f(x) de la variable aleatoria “X = centímetros cúbicos de un fármaco prescrito para el control de un ataque epiléptico”, es

(a) Comprobar que la altura del triángulo debe ser 20/3 para que y = f(x) sea densidad.

(b) Determinar la función de densidad f(x). (c) Calcular la probabilidad de que, por lo menos, 0´1 cc sea

prescrito. Interpretar el resultado. (d) Hallar la dosis promedio necesaria para el control de un ataque

epiléptico. Solución.

(a) El área de un triángulo es un medio de la base por la altura. Entonces,

ATRIÁNGULO = 1

2(0´3 ⋅h) =

PARA QUE SEA FUNCIÓN DE DENSIDAD 1⇒ h = 2

0´3= 20

3.

(b) Se trata de calcular la ecuación de una recta, pasando por el punto (0, 0) y de pendiente la tangente del

ángulo α que forma la recta con el eje x, es decir m = tg α = 20 3

0´3= 200

9, entonces la ecuación es

y − y0 = m x − x0( )(x0,y0 ) = (0,0), m = 200 9

⎫⎬⎪

⎭⎪⇒ y = 200

9x

La función de densidad es

f (x) =

0, para x < 02009

x, para 0 ≤ x ≤ 0´3

0, para x > 0´3

⎨⎪⎪

⎩⎪⎪

(c) P X ≥ 0 1́( ) = f (x)dx

0´1

+∞∫ = 200

9xdx

0´1

0´3⌠⌡⎮

= 89

“Aproximadamente, para el 89% de los ataques epilépticos se prescriben 0´1 cc o más de ese fármaco”

(d) µ = E(X ) = xf (x)dx

−∞

+∞∫ = x 200

9xdx

0

0´3⌠⌡⎮

= 0´2

“La dosis promedio, o bien, la dosis media necesaria para el control de un ataque epiléptico es de 0´2 centímetros cúbicos del fármaco”

VARIANZA Definición. Sea X una variable aleatoria continua, tomando valores en todo R. Se define la Varianza de X:

σ X

2 =Var(X ) = E X − µ( )2= x − µ( )2

f (x)dx−∞

+∞

∫ La fórmula abreviada resulta:

σ X

2 =Var(X ) = E X 2( ) − µ2 = x2 ⋅ f (x)dx−∞

+∞

∫ − µ2 PROPIEDADES DE LA ESPERANZA Y LA VARIANZA Sea X una variable aleatoria cualquiera (discreta o continua), se verifica:

(1) E aX + b( ) = aE(X ) + b a y b constantes ( E(b) = b )

(2) E X ±Y( ) = E(X ) ± E(Y )

Page 16: Tema 6. variables aleatorias y distribuciones de probabilidad

16

(3) Si X e Y son variables aleatorias independientes, entonces

E X ⋅Y( ) = E(X ) ⋅E(Y )

(4)

σ 2 aX + b( ) = a2σ 2(X ), (σ 2(b) = 0)

(5) Si X e Y son variables aleatorias independientes, entonces

σ 2 aX ± bY( ) = a2σ 2(X ) ± b2σ 2(Y )

FUNCIÓN DE DISTRIBUCIÓN (ACUMULATIVA) Definición. Sea X una variable aleatoria continua, tomando valores en todo R. Se define la función de distribución (acumulativa) de X

F :⎯ →⎯ 0,1⎡⎣ ⎤⎦

x → F(x) = P X ≤ x( ) = f (t)dt−∞

x∫

verificando,

(a) F es continua en todo R.

(b) F(x) = f (t)dt ⇒

−∞

x

∫ F es una primitiva de f, entonces ′F (x) = f (x)

(c) Para a y b números reales cualesquiera,

P a ≤ X ≤ b( ) = f (x)dx = F(b) − F(a)

a

b∫

Ejemplo. Muchos fenómenos de la Biología, la Física, la Química, etc, se expresan matemáticamente mediante una ley de probabilidad exponencial negativa, de la forma:

f (x) =

0 si x < 0k e— kx si x ≥ 0⎧⎨⎪

⎩⎪

(1) Comprobar que es función de densidad. (2) Calcular la función de distribución F(x).

Solución.

(1) La condición (2) de la definición de densidad es que el área bajo la gráfica de la función de densidad tiene que ser igual a 1, entonces

f (x)dx−∞

+∞∫ = f (x)dx

−∞

0∫

=0

+ f (x)dx0

+∞∫ = lim

b→+∞k ⋅e−kx dx

0

b∫ = lim

b→+∞−e−kx⎡⎣

⎤⎦0

b= lim

b→+∞−e−kb + e−k0{ } = 1, ∀k > 0

Por tanto, la función es de densidad, para cualquier valor positivo de la constante k.

(2)

(a) x < 0, F(x) = f (t)dt−∞

x∫ =

Si t<x<0 0 ⋅dt

−∞

x∫ = 0

(b) x ≥ 0, F(x) = f (t)dt−∞

x∫ =

t<0, o bien 0≤t≤x f (t)dt

−∞

0∫

0

+ f (t)dt0

x∫ = k ⋅e−kx dx

0

x∫ = −e−kt⎡

⎣⎤⎦0

x= 1− e−kx

Por tanto, podemos ya definir la función de distribución F(x) =

0, x < 0

1− e−kx, x ≥ 0

⎧⎨⎪

⎩⎪

Sus gráficas son

Page 17: Tema 6. variables aleatorias y distribuciones de probabilidad

17

VARIABLES CONTINUAS NOTABLES EN PROBLEMAS ESTADÍSTICOS DISTRIBUCIÓN NORMAL Definición. Se dice que X sigue una distribución normal de media µ y desviación típica σ y se representa por

X N µ,σ( ) si su función de densidad está dada por:

f (x) = 1

σ 2πe

−12

x−µσ

⎛⎝⎜

⎞⎠⎟

2

, − ∞ < x < +∞

Propiedades.

(a) Es simétrica respecto a la recta x = µ. (b) Presenta un máximo en x = µ. (c) Presenta dos puntos de inflexión: x = µ + σ y x = µ – σ. (d) Tiene como asíntota horizontal el eje x.

(Se comprueba que f(x) es realmente una densidad ya que

1σ 2π

e−

12

x−µσ

⎛⎝⎜

⎞⎠⎟

2

−∞

+∞⌠

⌡⎮⎮ dx = 1)

Los parámetros µ y σ determinan por completo la función de densidad normal y son, de hecho: µ = E(X) y σ(X) = desviación típica de X. ¿Cómo se calcula la

P a ≤ X ≤ b( ) ? Resulta muy complicado utilizando integración y la función de densidad

anterior. Por ello, se utilizan TABLAS. Ahora bien, hay que realizar una transformación de la variable aleatoria

X N µ,σ( ) a un tipo especial de variable aleatoria normal: aquella que tiene por media µ = E(X) = 0 y por

desviación típica σ(X) = 1.

Tipificación de la variable X, X N µ,σ( )⇒ Z = X − µ

σ N 0,1( )

Z se llama VARIABLE TIPIFICADA. De éste modo, si queremos hallar la

P a ≤ X ≤ b( ) hacemos

P a ≤ X ≤ b( ) = P a − µ

σ≤ X − µ

σ≤ b − µ

σ⎛⎝⎜

⎞⎠⎟= P a − µ

σ≤ Z ≤ b − µ

σ⎛⎝⎜

⎞⎠⎟

Page 18: Tema 6. variables aleatorias y distribuciones de probabilidad

18

Propiedades. Si

X1 N µ1,σ1( ) y X2 N µ2,σ2( ) , X1 y X2 independientes entre si, para cualquier número real a1 y a2 ⇒

a1X1 + a2X2 N a1µ1 + a2µ2, a1σ1

2 + a2σ22⎛

⎝⎞⎠

Esta propiedad se puede generalizar a "n" variables. TEOREMA DE MOIVRE

Si X B n,p( ) y si n → +∞⇒ Z = x − np

np 1− p( ) N 0,1( )

En la práctica se cambia de Binomial a Normal si

si n > 30 y 0 1́< p < 0´9o si n ⋅p >15 y n 1− p( ) >15

o si n > 30 y p ≅ 1 2

⎨⎪

⎩⎪

REGLA DE LA PROBABILIDAD NORMAL Sea

X N µ,σ( ) . Se verifica

(a) P µ − σ < X < µ +σ( ) = 0´68

(b) P µ − 2σ < X < µ + 2σ( ) = 0´95

(c) P µ − 3σ < X < µ + 3σ( ) = 0´99

“La probabilidad de que X tome un valor a una distancia máxima de su media de 1, 2 y 3 desviaciones típicas es, aproximadamente, 0´68, 0´95 y 0´99 respectivamente. Esto es equivalente a decir que, aproximadamente el 68%, el 95% y el 99% de las observaciones de X se encuentran entre la media y mas menos una, dos y tres veces la desviación típica, respectivamente” Representar gráficamente y comprobar, por ejemplo, el apartado (b).

(b)

P µ − 2σ < X < µ + 2σ( ) =Tipificando

P µ − 2σ − µσ

< X − µσ

< µ + 2σ − µσ

⎛⎝⎜

⎞⎠⎟= P −2 < Z < 2( )

=Paso a tablas

1− P Z < −2( ) + P Z > 2( )( ) =simetría 1− 2P Z > 2( ) = 0´9544 ≅ 0´95

Una aplicación muy importante de la regla de probabilidad normal aparece en análisis químicos-clínicos. Por ejemplo, en análisis de sangre: potasio, sodio, proteínas totales, colesterol, etc, se miden de forma rutinaria. Durante muchos años se han practicado lecturas con un gran número de personas. Esta información se ha ido empleando para establecer los valores medios y la cantidad de variabilidad esperada en individuos sanos con un alto grado de precisión. Estos valores pueden ser utilizados para establecer lo que llamamos: "LÍMITES 2-SIGMA", µ ± 2σ para cada variable estudiada. Por la regla de la probabilidad normal, aproximadamente un 95% de las personas sanas está comprendido entre estos límites; afortunadamente un 5% está fuera de éstos, con un 2´5% de lecturas anormalmente altas y un 2´5 % anormalmente bajas.

Page 19: Tema 6. variables aleatorias y distribuciones de probabilidad

19

Ejemplo. Sea X = nivel de potasio en una persona sana. Se sabe que X es una variable aleatoria normal con una media de 4.4 mlq/l y con una desviación típica de 0.45 mlq/l (miliequivalentes por litro). El 95% de las personas sanas presentan lecturas comprendidas entre µ − 2σ = 4.4 − 2 ⋅0.45 = 3.5 mlq/l y µ + 2σ = 4.4 + 2 ⋅0.45 = 5.3 mlq/l Si la lectura para un individuo en concreto está comprendida entre estos valores, entonces no existe ningún problema. Si la lectura está por debajo de 3.5 o por encima de 5.3, estamos ante un valor inhabitual.

Un valor de potasio 4.00 es aceptable. Un valor de potasio 5.7 sería un valor anormalmente alto. En el informe del laboratorio aparece

TEST POTASIO RESULTADO FUERA DE RANGO UNIDADES RANGO DE REFERENCIA 5.7 H. mlq/l (límites 2-sigma) 3.5–5.3

NOCIÓN DE GRADOS DE LIBERTAD “El número de grados de libertad, ν , de un conjunto de variables, es igual al número de variables independientes que contiene”. Este número viene dado por “ν = n – k”, siendo n el número de variables y k el número de relaciones que existen entre ellas. Ejemplo. Sean el conjunto de variables

X1, X2, ... ,Xn{ } . Si son independientes, entonces el número de grados de

libertad del conjunto es ν = n.

Calculemos su media, X =

Xii=1

n

∑n

.

Formemos un nuevo conjunto de variables

X1 − X , X2 − X , ... ,Xn − X{ } : “variables aleatorias desviación” . Queremos saber el número de grados de libertad de este nuevo conjunto de variables. Para ello, busquemos si existe alguna relación entre ellas:

X i − X( )

i=1

n

∑ = Xii=1

n

∑ − Xi=1

n

∑ = nX − nX = 0

Esto implica que de las “n variables aleatorias desviación”, solo hay “n – 1” independientes, ya que conocidas “n – 1”, la otra se conoce despejando en la ecuación

Xn − X = − Xi − X( )

i=1

n−1

Luego, el conjunto

X1 − X , X2 − X , ... ,Xn − X{ } de las “variables desviación”, tiene:

número de grados de libertad = ν = n – 1

Page 20: Tema 6. variables aleatorias y distribuciones de probabilidad

20

DISTRIBUCIÓN χ2 DE PEARSON (con "n" grados de libertad)

Si X1, X2, ..., Xn son variables aleatorias N(0, 1) y X1, X2, ..., Xn son independientes entre si, entonces la variable aleatoria:

χn2 = X1

2 + X 22 + ... + Xn

2

recibe el nombre de χ2 ( ji-cuadrado) de Pearson con "n" grados de libertad.

Propiedades y manejo de tablas

(1) El campo de variabilidad es (0,+∞). (2) La distribución depende de "n" = nº de grados de libertad = nº de variables aleatorias N(0,1)

independientes que se utilizan en su construcción. (3) Los parámetros de la distribución son: µ = n = punto de equilibrio de la curva, σ2 = 2n y σ = 2n (4) Tablas: para distintas áreas α (niveles de significación), aparecen las abscisas de los extremos

izquierdos de las mismas: χα ,n

2

χα ,n2 = abscisa del extremo izquierdo de la base de la cola derecha de área α.

P χn2 ≥ χα ,n

2( ) = α

(5) Si χ12 y χ2

2 son ji-cuadrados tales que: χ12

tiene "n1" grados de libertad y χ22 tiene "n2" grados de

libertad ⇒ χ2 = χ12 + χ2

2 es una ji-cuadrado con "n1+ n2" grados de libertad. (6) Manejo de tablas (ver ejercicios al final del tema).

DISTRIBUCIÓN "t" DE STUDENT Sean χn

2 una ji-cuadrado con "n" grados de libertad y X N 0,1( ) independientes entre si, entonces la variable

aleatoria definida por:

X

χn2 n

= X n

χn2

es una t de Student con "n" grados de libertad. Propiedades y manejo de tablas

(1) El campo de variabilidad de la función de densidad es todo R. (2) La función de densidad de una t de Student, es campaniforme y simétrica. (3) Manejo de tablas: con la notación tα,n se indica la abscisa del extremo izquierdo de la base de la cola

derecha de área α. Se verifica tα ,n = −t1−α ,n

(Cuánto mayor es el número de grados de libertad, n, tanto más se parece la gráfica a la de la N(0,1)). (ver ejercicios al final del tema).

Page 21: Tema 6. variables aleatorias y distribuciones de probabilidad

21

DISTRIBUCIÓN F DE FISHER-SNÉDECOR Sean

χn1

2 y χn2

2 variables ji-cuadrado con "n1" y "n2" grados de libertad, respectivamente, independientes entre

si. Entonces, la variable aleatoria definida por

F =

χn1

2 n1

χn2

2 n2

es una F de Fisher–Snédecor con n1 y n2 grados de libertad. Propiedades y manejo de tablas

(1) El campo de variabilidad de la función de densidad es (0,+∞). (2) Gráficas de F:

P Fn1,n2≤ f( ) =

0.900.950.9750.99

⎨⎪⎪

⎩⎪⎪

fα ,n1,n2

= 1f1−α ,n2,n1

(3) Manejo de tablas (ver ejercicios al final del tema) Ejercicios de manejo de tablas. Ejercicio 1º. Calcular:

(a) P Z ≤ −1,52( )

(b) P Z ≤1,37( )

(c) F(1,37) (d)

P Z ≥ −1,42( )

(e) P −1,21≤ Z ≤1,73( )

Hallar el valor de z tal que:

(a) P Z ≤ z( ) = 0,05

(b) P Z ≤ z( ) = 0,75

(c) P Z ≥ z( ) = 0,10

(d) P Z ≥ z( ) = 0,80

(e) P −z ≤ Z ≤ z( ) = 0,95

(f) P −z ≤ Z ≤ z( ) = 0,99

Ejercicio 2º. 1) Considérese una variable aleatoria ji-cuadrado con 10 grados de libertad. Se indica por χ10

2 . (Su valor medio es 10 y su varianza es 20). Calcular:

(a) P χ10

2 ≤ 2,56( )

(b) P χ10

2 ≥16( )

(c) El punto con el 5% de área a su derecha.

Page 22: Tema 6. variables aleatorias y distribuciones de probabilidad

22

(d) El punto con el 95% de área a su derecha. (e)

P 3,25 ≤ χ10

2 ≤ 20,5( )

2) Considérese ahora una variable aleatoria ji-cuadrado con 9 grados de libertad. Calcular: (a)

P χ9

2 ≤ 2,09( )

(b) P χ9

2 ≥11,4( )

(c) P 14,7 ≤ χ9

2 ≤16,9( )

(d) El punto con área 0,025 a su derecha. (e) El punto con área 0,01 a su izquierda (f) Los puntos χ1

2 y χ22 , tales que, el área a la derecha de χ2

2 iguale al área a la izquierda de χ12 y

P χ1

2 ≤ χ92 ≤ χ2

2( ) = 0,90

Ejercicio 3º. 1) Indicar el punto “t” tal que:

(a) P t15 ≤ t( ) = 0,95 ; (b)

P t15 ≥ t( ) = 0,025 ; (c)

P t15 ≤ t( ) = 0,05 ; (d)

P t15 ≥ t( ) = 0,975 .

2) Calcular las probabilidades:

(a) P t15 ≥ 2,602( ) ; (b)

P t15 ≤ −1,341( ) ; (c)

P −1,753 ≤ t15 ≤1,753( )

3) Calcular el punto “t” tal que:

(a) P −t ≤ t15 ≤ t( ) = 0,95 ; (b)

P −t ≤ t15 ≤ t( ) = 0,99

Ejercicio 4º. 1) Calcular las siguientes probabilidades:

(a) P F24;15 ≤ 2,2878( ) ; (b)

P F20;3 ≤14,1674( ) ; (c)

P F∞;29 ≤ 2,034( )

2) Calcular los puntos: (a)

F0,05;15;12 ; (b)

F0,01;30;5 ; (c)

F0,1;40;9 ; (d)

F0,1;50;9 (e)

F0,9;24;15 ; (f)

F0,95;40;30 ; (g)

F0,975;20;20 ; (h)

F0,99;20;35

SOLUCIONES DE LOS EJERCICIOS Ejercicio 1º. Calcular:

(a) 0,0643 (b) 0,9147 (c) 0,9147 (d) 0,9222 (e) 0,8451 Hallar el valor de z tal que:

(a) z = –1,645; z0,05 = 1,645; (b) z = 0,67; z0,25 = 0,67; (c) z = 1,28; z0,10 = 1,28; (d) z = –0,84; z0,20 = 0,84; (e) z = 1,96; z0,025 = 1,96; (f) z = 2,58; z0,005 = 2,58.

Ejercicio 2º. 1)

(a) P χ10

2 ≤ 2,56( ) = 0,01; χ0,99;102 = 2,56 ; (b)

P χ10

2 ≥16( ) = 0,10; χ0,10;102 = 16 ;

(b) χ0,05;10

2 = 18,307

(c) χ0,95;10

2 = 3,94

(d) P 3,25 ≤ χ10

2 ≤ 20,5( ) = 0,95; χ0,025;102 = 20,5; χ0,975;10

2 = 3,25

2) (a)

P χ9

2 ≤ 2,09( ) = 0,01; χ0,99;92 = 2,09 ; (b)

P χ9

2 ≥11,4( ) = 0,25; χ0,25;92 = 11,4

Page 23: Tema 6. variables aleatorias y distribuciones de probabilidad

23

(c) P 14,7 ≤ χ9

2 ≤16,9( ) = 0,05 ; (d) χ0,025;9

2 = 19,023 ; (e) χ0,99;9

2 = 2,088 ;

(f) P χ1

2 ≤ χ92 ≤ χ2

2( ) = 0,90; χ12 = χ0,95;9

2 = 3,325; χ22 = χ0,05;9

2 = 16,919

Ejercicio 3º. 1) Indicar el punto “t” tal que: (a)

P t15 ≤ t( ) = 0,95; t = t0,05;15 = 1,753 ; (b)

P t15 ≥ t( ) = 0,025; t = t0,025;15 = 2,131 ;

(c) P t15 ≤ t( ) = 0,05; − t = t0,05;15 = 1,753 ⇒ t = −1,753 ;

(d) P t15 ≥ t( ) = 0,975; − t = t0,025;15 = 2,131⇒ t = −2,131.

2) Calcular las probabilidades: (a)

P t15 ≥ 2,602( ) = 0,01; t0,01;15 = 2,602 ; (b)

P t15 ≤ −1,341( ) = 0,10; t0,10;15 = 1,341;

(c) P −1,753 ≤ t15 ≤1,753( ) = 0,90; t0,05;15 = 1,753

3) Calcular el punto “t” tal que: (a)

P −t ≤ t15 ≤ t( ) = 0,95 ⇒ t = t0,025;15 = 2,131; (b)

P −t ≤ t15 ≤ t( ) = 0,99 ⇒ t = t0,005;15 = 2,947

Ejercicio 4º. 1) Calcular las siguientes probabilidades:

(a) P F24;15 ≤ 2,2878( ) = 0,95; F0,05;24;15 = 2,2878

(b) P F20;3 ≤14,1674( ) = 0,975; F0,025;20;3 = 14,1674

(c) P F∞;29 ≤ 2,034( ) = 0,99; F0,01;∞;29 = 2,034

2) Calcular los puntos:

(a) F0,05;15;12 = 2,6169 ; (b)

F0,01;30;5 = 9,379 ; (c)

F0,1;40;9 = 2,23635 ; (d)

F0,1;50;9 = 2,2180

(e) F0,9;24;15 = 0,56082 ; (f)

F0,95;40;30 = 0,5733 ; (g)

F0,975;20;20 = 0,40576 ; (h)

F0,99;20;35 = 0,3644 .

Ejercicio de la distribución normal y del paso de la binomial a la normal Ejercicio 5º. En una población de 25000 habitantes adultos , su perímetro torácico se distribuye normalmente con una media de 90 centímetros y una desviación típica de 4 centímetros.

(a) ¿Cuántos individuos tendrán un perímetro torácico inferior a 86´4 cm? (b) ¿Cuántos tendrán un perímetro torácico entre 86´4 y 93´6 cm? (c) ¿Qué perímetro torácico deberá tener un individuo de esa población para que el 23% de los habitantes

adultos lo tenga inferior a él? Solución. Definimos en primer lugar la variable aleatoria,

X = cm de perímetro torácico de un individuo adulto de esa población (de 25000 individuos)X N µ = 90cm,σ = 4cm( )

(a) P X < 86´4( ) =

Tipificamos P Z < 86´4 − 90

4⎛⎝⎜

⎞⎠⎟= P Z < −0´9( ) =

Paso a tablas P Z > 0´9( ) = 0 1́841

El 18´41% de los individuos de esa población de 25000, tienen un perímetro torácico inferior a 86´4 cm. el 18´41% de 25000 son 4602 individuos. Por tanto, “4602 individuos de esa población tienen un perímetro torácico inferior a 86´4 cm”

(b) P 86´4 < X < 93´6( ) =

Tipificamos P −0´9 < Z < 0´9( ) =

Paso a tablas 1− 2P Z > 0´9( ) = 0´6318

“15795 individuos de esa población tienen un perímetro torácico entre 86´4 y 93´6 cm”

Page 24: Tema 6. variables aleatorias y distribuciones de probabilidad

24

(c) Se puede hacer directamente sobre el dibujo de la curva normal X y de su tipificada Z

P X < a( ) = 0´23

P Z < a − 90

4⎛⎝⎜

⎞⎠⎟= 0´23

z = a − 90

4− 0´74 ⇒ a = 90 − 0´74 ⋅4 = 87´04

“El 23% de los individuos de esa población (serían 5750 individuos), tienen un perímetro torácico inferior a, aproximadamente, 87 centímetros” Ejercicio 6º. La probabilidad de que un individuo de una población tenga los ojos marrones es 0´6. Se extrae una muestra aleatoria de 1100 personas de esta población. Se pide

(a) La probabilidad de que entre 670 y 675 (incluidos) personas de esa muestra tengan los ojos marrones. (b) Probabilidad de que a lo sumo 680 personas tengan los ojos marrones. (c) Interpretar los resultados anteriores.

Solución. Definimos en primer lugar la variable aleatoria,

X = número de personas con ojos marrones en muestras de n = 1100 personasX B n = 1100,p = 0´6( )

Puesto que,

n ⋅p = 660 >>15 yn ⋅ (1− p) = 440 >>15

⎫⎬⎭ MOIVRE⎯ →⎯⎯⎯ ′X N µ = n ⋅p = 660,σ = n ⋅p ⋅ (1− p) = 660 ⋅0´4 = 16´2( )

(a)

P 670 ≤ X ≤ 675( ) =corrección de medio punto

P 669´5 < ′X < 675´5( ) =Tipificación

P 669´5 − 66016´2

< Z < 675´5 − 66016´2

⎛⎝⎜

⎞⎠⎟

= P 0´58 < Z < 0´95( ) =Paso a tablas

P Z > 0´58( ) − P Z > 0´95( ) = 0´2810 − 0 1́711= 0 1́099

(b) P X ≤ 680( ) =

corrección de medio punto P ′X < 680´5( ) =

Tipificación P Z < 1́26( ) =

Paso a tablas 1− P Z > 1́26( ) = 0´8962

(c) “Aproximadamente, en el 11% de las muestras de 1100 personas de esa población, entre 670 y 675 (incluidas) tienen los ojos marrones” “Aproximadamente, en el 90% de las muestras de 1100 personas de esa población, a lo sumo 680 tienen los ojos marrones”