Upload
others
View
6
Download
0
Embed Size (px)
Citation preview
C a p í t u l o 1 5 L o s E s t a d í s t i c o s y s u s D i s t r i b u c i o n e s | 365
CAPÍTULO 15 LOS ESTADÍSTICOS Y SUS DISTRIBUCIONES ‐LAS DISTRIBUCIONES MUESTRALES‐
15.1 Introducción Recordemos que una población la hemos definido como el conjunto de objetos de
los cuales se toma una muestra aleatoria. Para una población de observaciones de interés, pensamos en un valor numérico asignado a las unidades particulares de observación como un valor de una variable aleatoria; cuya distribución es la distribución de la población que tiene una media y una varianza y otros parámetros que caracterizan a la distribución; y podemos visualizar aen la distribución de la población como una distribución de frecuencia basada en un gran número finito de casos. Tales distribuciones fueron el objeto de estudio de los capítulos sobre la teoría de la probabilidad, particularmente en el que se dedicó a las distribuciones de probabilidad discretas y continuas y se consideran como distribuciones teóricas el proceso del muestreo aleatorio estudiado en el capítulo anterior con el remplazo de las unidades, asegura que la frecuencia relativa en el largo plazo de cualquier valor de la variable aleatoria es igual a la probabilidad de aquel valor. En este capítulo idealizaremos la distribución de la población y tratarla como si la variable aleatoria fuera continua lo cual es virtualmente imposible en las observaciones del mundo real pero asumiremos que es una aproximación al estado de sucesos de la población.
Igualmente, vale recordar que los valores que caracterizan a la distribución de la población son sus parámetros de tendencia central, de dispersión de sesgo y aplanamiento y los denotamos con letras griegas minúsculas y estrictamente hablando son valores arbitrarios que entran en las funciones de probabilidad aunque el término se usa para significar cualquier valore que resume la distribución de la población: Así como los parámetros son características que sintetizan a la población, los estadísticos son medidas sumarias de las muestras y al igual que aquellos también se tienen estadísticos de tendencia central de dispersión, de sesgo y aplanamiento como se verá en este capítulo; y se denotan con letras del alfabeto español correlativas, tal como . Para la media y para la vaianza.
En los capítulos sobre probabilidad estudiamos las distribuciones y los parámetros de las poblaciones: Como estamos interesados en la inferencia estadística de los parámetros de la población a partir de la muestra sacada aleatoriamente, debemos relacionar los estadísticos de la muestra, particularmente la media y la varianza con los parámetros media y varianza de la población bajo estudio ya que no se conocen; para lo cual necesitamos conocer la noción de distribución muestral.
Más formalmente, una muestra aleatoria de tamaño es un concepto teórico que
representa un conjunto de variables aleatorias independientes
, , , … , (15.1) Contenido en la población, antes de sacar la muestra, cuyos elementos tienen la
misma función de probabilidad de la población .
366 | C a p í t u l o 1 5 L o s E s t a d í s t i c o s y s u s D i s t r i b u c i o n e s
15.2 Los estadísticos y los estimadores Un estadístico es cualquier función que depende solamente de los valores de una
muestra aleatoria y que no contiene ningún parámetro desconocido; así, si , , , … , es una muestra aleatoria de tamaño sacada de la población bajo
estudio, entonces , , , … , (15.2)
es un estadístico. Más aún, como los estadísticos son funciones de las muestras aleatorias, entonces
los estadísticos son variables aleatorias y tienen todas las propiedades de las distribuciones de probabilidad que se estudiaron en los capítulos 9 a 13, por lo que podemos hablar de las distribuciones de probabilidad de los estadísticos, conocidas comúnmente como las distribuciones muestrales, del valor esperado, la media, la varianza y así.
Por otro lado, un estadístico que se usa para estimar el parámetro de la población se llama estimador del parámetro, y un valor específico del estadístico calculado con los datos de una muestra particular se conoce como estimado del parámetro. Un capítulo posterior lo dedicaremos a estudiar la teoría de la estimación.
Ejemplo 15.1 Si deseamos estimar la media de la población ‐recuérdese que la
media de la población es un parámetro y que éstos se denotan con letras griegas minúsculas‐ comúnmente se utiliza el estadístico media que se define como
… 15.3
Obsérvese por un lado que la notación cambia a letras del abecedario español y por
tratarse variables aleatorias se utilizan las letras mayúsculas; o por otro que la media es efectivamente una función de la muestra aleatoria que no contiene parámetros como debe suceder con todos los estimadores.
Con este estadístico calculamos un estimado de la media con base en los datos de una muestra que se extrae aleatoriamente de ella ‐obsérvese que la notación es con la minúscula correspondiente del estimador‐; como se bosqueja en la figura 14.1, la media de la muestra 1 es , para la muestra aleatoria 2 se tendrá ; para la muestra 3 su media es y así sucesivamente. En lo general, como las muestras se extraen aleatoriamente de la población las medias serán diferentes, aunque cabe la remota posibilidad de que algunas de ellas sean iguales.
C a p í t u l o 1 5 L o s E s t a d í s t i c o s y s u s D i s t r i b u c i o n e s | 367
n
n
n
233,sx
1x
211, sx
222 , sx
2x 3x
21s
22s2
3s
)(xf
x
2Xs
)( 2Xsf
POBLACIÓN f(µ,σ)
muestras
23 3,x s
Figura 14.1 Distribuciones Muestrales de la media y la Varianza
Conviene reiterar que es estadístico media ‐ ‐ es una función de una muestra
aleatoria o conjunto de variables aleatorias, con cuyos valores particulares de estas variables aleatorias que se obtienen al momento de sacar la muestra, se calculan los estimados. En este caso es un estimador del parámetro .
Para las tres muestras de la figura 14.1 se tienen tres estimados del estimador : , , ; es decir, tres valores de la variable aleatoria que se llama el estadístico
media. En resumen, los estadísticos son variables aleatorias porque son funciones de las
muestras aleatorias, los estimadores son estadísticos que se utilizan para estimar los parámetros de la población y los estimados son valores particulares de los estimadores que se determinan con los datos de la muestra.
15.3 Distribuciones muestrales Como vimos previamente, los trabajos estadísticos utilizan tres distribuciones: la
distribución de la población, que se caracteriza con sus parámetros expresados mediante letras griegas minúsculas, por ejemplo µ y σ ; la distribución muestral que son las distribuciones de los estimadores de los parámetros de la población conocidos como estadísticos, que son variables aleatorias al ser funciones de una muestra aleatoria , , , … , y se representan como las variables aleatorias:
, ó ; y la distribución de los datos de la muestra o distribución de frecuencias que es la representación gráfica o tabular que se obtiene al clasificar, mediante ciertos criterios los elementos de la muestra, de la cual nos ocuparemos en un capítulo posterior. Esta sección se dedicará al estudio de las distribuciones muestrales.
En los trabajos estadísticos el interés primario consiste en calcular los valores de los estadísticos tales como la media y la varianza cuando se ha sacado la muestra. Antes de observar la información de la muestra el estadístico es una variable aleatoria con una distribución de probabilidad particular, como sucede con el número de éxitos de una muestra de tamaño de un proceso de Bernoulli es una variable aleatoria ‐ ‐ estadístico antes de extraer la nuestra y es una variable aleatoria con distribución de probabilidad binomial que se definió en el capítulo 12, y la media de la muestra ‐ ‐,
368 | C a p í t u l o 1 5 L o s E s t a d í s t i c o s y s u s D i s t r i b u c i o n e s
antes de sacarla, también es una variable aleatoria que depende de la población y de esquema utilizado para sacar la muestra.
Las distribuciones muestrales de los estadísticos tales como , o tienen todas las propiedades de la probabilidad de las distribuciones que se estudiaron en los capítulos 9 a 13 y, para distinguirlas, se les llamarán distribuciones muestrales las cuáles se definen como distribuciones teóricas de probabilidad que exhiben las relaciones entre los posibles valores de un estadístico y la densidad de probabilidad asociada con cada valor del estadístico de todas las posibles muestras de tamaño que se extraen de la población bajo estudio.
De esta definición se desprende que para una muestra de tamaño 1 es un estadístico muestral cuya distribución es la distribución de la población pero; en general, las distribuciones muestrales de los estadísticos no son las distribuciones de de la población; sin embargo, las distribuciones muestrales siempre dependen de las distribuciones de las poblaciones de donde se sacan las muestras.
En los capítulos precedentes hemos introducido las distribuciones muestrales como en el caso de las distribuciones binomiales que se basan en dos categorías de la población –éxitos o fracasos‐ de un proceso de Bernoulli, en el cual se saca una muestra aleatoria de tamaño de la población y se calcula el número de éxitos ‐ ‐ y tal distribución es una función que muestra la relación entre los resultados de cada muestra posible y la probabilidad teórica de ocurrencia; también en la distribución multinomial en la cual la población tiene varias categorías de eventos y al sacar una muestra aleatoria de tamaño , y la distribución nos da la probabilidad del número de elementos de ocurrencia de cada clase.
En lo general, y particularmente para el trabajo estadístico, es posible establecer distribuciones muestrales para cualquier característica de una muestra, correlativas a los parámetros generales de las distribuciones de probabilidades estudiados en el capítulo 11, como para la media, la varianza, la moda, la mediana o cualquier otra mediada central, de dispersión, de sesgo, aplanamiento u otras más. Estos hechos son importantes para la teoría estadística porque en tales distribuciones se basa la inferencia sobre los parámetros de la población que tienen su raíz en las muestras aleatorias y en la probabilidad de que el valor del estadístico de una muestra se saque al azar de la población bajo estudio.
Para finalizar se considera importante remarcar que el trabajo estadístico debe tomar en cuenta las tres clases de distribuciones. La primera clase es la de las distribuciones de la población y consiste en las distribuciones teóricas que asocian los valores de la variable aleatoria con las probabilidades y corresponde a las estudiadas en los capítulos previos; la segunda clase, es la de las distribuciones muestrales, motivo principal del presente capítulo, que son distribuciones teóricas de probabilidad que relacionan los valores de las muestras estadísticas con sus probabilidades de ocurrencia sobre todas las posibles muestras; y la tercera clase es las de distribuciones de frecuencia que las estudiaremos en el siguiente capítulo de la estadística descriptiva.
15.3.1 Distribución muestral del estadístico media ‐ ‐ Por extensión, si la media de la distribución de la población es y, debido a la
aleatoriedad de la extracción de las muestras, si de la misma población se sacan
C a p í t u l o 1 5 L o s E s t a d í s t i c o s y s u s D i s t r i b u c i o n e s | 369
muestras de tamaño , se mide numéricamente a cada elemento de la misma podemos calcular el estimado de la media de cada muestra ; entonces la distribución teórica que relaciona los posibles valores de las medias de las muestras con la densidad de probabilidad sobre todas las posibles muestras de tamaño ; se llama la distribución muestral del estadístico media o de la media.
Si es cualquier estadístico, o sea cualquier variable aleatoria, si ésta es discreta ya sabemos que su valor esperado o la media de su distribución es
∑ (15.4)
Y si el estadístico es continuo ya sabemos que
(15.5) También sabemos que la distribución muestral de tiene varianza
(15.6) La cual nos da una medida de la dispersión de de los valores particulares de ‐los
estimados ‐ con respecto su valor promedio para todas las posibles muestras de tamaño .
Es de suma importancia notar que la desviación estándar de la distribución muestral ‐ ‐ refleja el grado al cual los valores de las muestras del estadístico tienden a ser improbables de su valor esperado ‐a alejarse de su media‐ o a estar en error; por lo que se le llama el error estándar de estadístico en lugar de la desviación estándar. Cuando nos referimos al error estándar de la media de la muestra aludimos a la desviación estándar de la distribución de las posibles medias de la muestra de todas las posibles muestras aleatorias de tamaño que se pueden extraer de la población bajo estudio. Este concepto de error estándar es aplicable a todas las distribuciones muestrales.
Como indicamos en la expresión 15.3, Si el estadístico general se particulariza
para la media, antes de que se saque la muestra, se tiene
∑ (15.3’)
Donde los valores de la muestra y de la media de la muestra son variables
aleatorias. Aplicando el operador valor esperado a la variable aleatoria media y sus reglas ya
vistas, tenemos
∑ ∑ ∑ (15.7)
Más aún, como cada es una observación elegida aleatoriamente de la población
bajo estudio, su distribución es la de la población porque aún no se saca la muestra, por lo tanto
370 | C a p í t u l o 1 5 L o s E s t a d í s t i c o s y s u s D i s t r i b u c i o n e s
(15.8) Para toda . Sustituyendo (15.8) en (15.7) se tiene
∑
(15.9) Lo que significa que el valor esperado de la distribución muestral de la media ‐ ‐ es
igual a la media de la población, pero este resultado no implica que la distribución muestral de la media sea igual a la distribución de la población porque generalmente son muy diferentes y dependen del tamaño de la muestra hasta el límite en el cual la muestra fuera un censo que abarcara a todos los elementos de la población.
Si ahora aplicamos el operador varianza estudiado en el capítulo 11 a la expresión 15.3’ y tomando en cuenta sus reglas tenemos
∑ ∑ ∑ (15.10)
Pero como cada es una observación elegida aleatoriamente de la población bajo
estudio, su distribución es la de la población porque aún no se saca la muestra, por lo tanto
(15.11) Para toda . Sustituyendo (15.11) en (15.10) se tiene
∑ (15.12)
Lo que indica que la varianza de la distribución muestral de la media es igual a la
varianza de la población dividida entre el tamaño de la muestra. Y el error estándar de esta distribución muestral de es
√ (15.13)
Con base en la expresión anterior, es importante observar que a medida que
aumenta el tamaño de la muestra se tienen estimadores más precisos de la media de la población; si 1 el error estándar de la distribución es igual a la varianza de la población y a medida que el tamaño de la muestra aumenta este error va disminuyendo, hasta el caso límite en el que dicho tamaño es infinito o abarca todos los elementos de la población –se hace un censo‐ en cuyo caso el error estándar es cero y la media de la muestra es igual a la de la población. Por lo anterior podemos concluir que, a mayor tamaño de la muestra, es más probable que la media de la muestra se acerque más a la media de la población, lo cual es consistente con la ley de los grandes números y el teorema de Chebyshev que estudiamos previamente.
Puesto que el estadístico media es una variable aleatoria, entonces podemos hacer la transformación a la forma estandarizada usando la regla ya estudiada utilizando las expresiones 15.9 y 15.13.
C a p í t u l o 1 5 L o s E s t a d í s t i c o s y s u s D i s t r i b u c i o n e s | 371
√ (15.14)
Ejemplo 15.2 Si la distribución de la población de la edad de los académicos de la Facultad de Ingeniería tiene una media de 45 años y una desviación estándar de 15, para una muestra aleatoria de 25 académicos, se tiene que 45 y
9. Si al sacar la muestra esta tiene una media 48 años, el correspondiente valor estandarizado es
√
1. Si aumentamos la muestra a 625 académicos y resulta también
48, el nuevo valor estandarizado será
√
5.
En ambos casos la media de la muestra está 3 años alejada de la media de la
población ‐48 45 3‐ pero al aumentar la muestra el valor estandarizado esta mucho más alejado de 0, lo que sorprende observar esta diferencia cuando la muestra es grande. Como hasta ahora solo conocemos la media y la varianza de la distribución muestral de la media, con la desigualdad de Chebyshev podemos estimar la probabilidad de este evento.
| | 3 1 1 . 0.96 O sea que la probabilidad de que la diferencia | | 3 sea 0.96 , así, 48
años es un evento inusual. Este tipo de razonamientos son muy útiles cuando se hacen inferencias de la media de la población.
15.3.1.1 El teorema del límite central En los trabajos estadísticos, se desea que la población que se está estudiando sea
normal o se asume que es normal, pero debemos conocerla con certeza para que los razonamientos y las técnicas que se utilicen sean apropiados. Si un estudio económico está interesado en los ingresos de cierta población, la distribución de estos es marcadamente sesgada positivamente y la suposición de normalidad desvirtuaría sensiblemente el estudio ya que sabemos que la distribución normal es simétrica. El conocimiento de la distribución de la población puede tenerse de la evidencia empírica o por procedimientos teóricos.
En las inferencias sobre la media de la población es indispensable tener un conocimiento cabal la distribución muestral de la media, no nada más su media y su varianza como hasta ahora.
Una primera propiedad que podemos establecer consiste en que cuando la media de una muestra aleatoria de tamaño se saca de una población que se distribuye
372 | C a p í t u l o 1 5 L o s E s t a d í s t i c o s y s u s D i s t r i b u c i o n e s
normalmente con parámetros y , la distribución de también se distribuye normalmente con parámetros y
√ .
Ejemplo 15.3 En estudios de ingeniería mecatrónica la interface hombre‐máquina es
importante. Los botones de los sistemas que controla el operador deben colocarse a distancias tales que no le produzcan esfuerzos ni posiciones extremas e incómodas, para lo cual se utilizan medidas antropométricas para determinar las distancias entre los tableros de control y los operadores; sobre todo en lugares donde el espacio es reducido como sucede en las cabinas de los aviones. Una de estas medidas es el alcance máximo.
Las investigaciones sobre antropometría reportan que el alcance máximo de los operadores se distribuye normalmente con media 82.12 y desviación estándar 4.14 , si aplican los siguientes fractiles:
Fractil Z (en cm)
(en cm) 1 ‐5.9182 72.39 5 ‐4.1656 75.438 50 0 82.042 95 4.1656 88.9 99 5.9182 91.694
Si las especificaciones de diseño solicitan que un tablero de control se coloque para
el 95% de los operadores puedan alcanzarlo sin agacharse, entonces debe localizarse a 88.9 cm del respaldo.
Puesto que se conocen los parámetros de la población, ya no se requiere que un investigador recolecte una muestra sobre el alcance máximo, puesto que esta se saca solamente si se desconocen los parámetros de la población; pero esta población puede usarse para ilustrar la distribución muestral de .
Puesto que la distribución de la población es normal, la distribución muestral de la media también es normal con parámetros 82.12 y
√ . Obsérvese
que la varianza de esta distribución muestral depende del parámetro particular que identifica al miembro particular de la familia de las distribuciones muestrales de la
media que es de interés, por ejemplo, si 10 tenemos ~ 82.12, .√
1.31 ; si 50 tenemos que la distribución de interés es ~ 82.12,.
√0.5855 ; y si 100 , ~ 82.12, .
√0.4140 que son 3
miembros de la distribución muestral de la media que se distribuyen conforme a la normal, con la misma media pero diferentes varianzas en las que se puede observar que a medida que aumenta el tamaño de la muestra el error estándar disminuye como ya lo habíamos anticipado y como se ilustra en la figura 15.2, La curva con más dispersión corresponde a la de la población y las tres siguientes son las de las distribuciones muestrales que muestran la disminución del error estándar ‐las diferencias disminuyen‐ a medida que aumenta el tamaño de la muestra.
C a p í t u l o 1 5 L o s E s t a d í s t i c o s y s u s D i s t r i b u c i o n e s | 373
En resumen, para una población que se distribuye normalmente, el error estándar
de determina la cercanía de la media de la muestra calculada ‐ , el estimado‐ a la media de la población, y una muestra con pequeño error estándar proporciona un estimado que representa más fidedignamente la media de la población; los factores determinantes del error estándar son la varianza de la población y el tamaño de la muestra ‐ ‐ como se desprende de la ecuación 15.13.
Ejemplo 15.4 En el centro de Instrumentación y Registro Sísmico ‐CIRES‐se prueban
los diseños de los amplificadores de los radios que transmiten las señales sísmicas desde la brecha de Guerrero hasta la ciudad de México y los prototipos determinan cuáles están libres de distorsión a las altas frecuencias que se utilizan; las especificaciones establecen que media la máxima distorsión de frecuencias debe ser 50 kHz con una desviación estándar de 5 kHz. El ingeniero de diseño desconoce media de la máxima distorsión de frecuencias del diseño que propondrá para la producción ‐‐ y solo lo recomendará si una muestra de 100 pruebas registran lecturas arriba
de 50 kHz. Si el nuevo amplificador es mejor que el que se está utilizando y el verdadero nivel de es 51 kHz podemos calcular la probabilidad de la calculada sea tan atípicamente pequeña que falle el diseño de esta prueba como sigue.
Como los parámetros de la población se desconocen, se toma la desviación estándar de diseño 5 y suponiendo que la población de las frecuencias de máxima distorsión se distribuye normalmente, entonces
√0.5 y 50| 51
.0.0228
Puesto que la desviación estándar de la población debe ser mayos, por ejemplo 10
kHz, la probabilidad de que el amplificador diseñado falle la prueba es √
1 y 50| 51 0.1587 Como ya se vio, a mayor se tiene mayor error estándar y esto incrementa la
oportunidad de un resultado erróneo de la prueba.
Mean,Std. dev82.12,4.1482.12,1.3182.12,0.58582.12,0.414
Figura 15.2 Distribuciones de la población y de las medias
x
f(x) y
f(x'
)
72 77 82 87 920
0.2
0.4
0.6
0.8
1
374 | C a p í t u l o 1 5 L o s E s t a d í s t i c o s y s u s D i s t r i b u c i o n e s
Ya vimos que si la población de la población es normal la distribución muestral de también es normal con la misma media de la población – ‐ pero con desviación estándar diferente ‐
√ ‐. Esta propiedad también puede aplicarse de manera
aproximada si la distribución de la población NO ES NORMAL gracias al teorema del Límite Central según el cual si una población con parámetros generales media y desviación estándar y representa la media de observaciones aleatorias independientes, entonces la distribución muestral de tiende a una distribución normal con parámetros
√ cuando tiende a infinito.
El teorema del Límite Central es una estupenda herramienta para aproximar la distribución muestral de a la distribución normal independientemente de la forma de la distribución de la población como se ilustra en la figura 15.3.
Figura 15.3 Ilustración del teorema del Límite Central que muestra la tendencia a la
normalidad de
Lower limit,Up0,2
Distribución de la población
x
f(x)
0 0.5 1 1.5 20
0.6
1.2
n=2
Distribución trianguilar
x
f(x)
0 0.4 0.8 1.2 1.6 20
0.2
0.4
0.6
0.8
1
n=35
Distribución Normal
x
f(x)
-10 -6 -2 2 6 100
0.04
0.08
0.12
0.16
0.2
C a p í t u l o 1 5 L o s E s t a d í s t i c o s y s u s D i s t r i b u c i o n e s | 375
La distribución superior representa la de la población que es una distribución uniforme, si 2 la distribución muestral de adquiere la forma triangular y, cuando 35 dicha distribución puede considerarse normal.
Ejemplo 15.5 El tiempo de vida de los componentes electrónicos de los
amplificadores mencionados en el ejemplo anterior, como ya vimos, tienen una distribución exponencial ‐ver capítulo 13‐. Para uno de ellos el Tiempo Medio Entre Fallas ‐MTBF o TMEF‐ es desconocido pero dentro de la gama de valores que puede tomar consideremos que 0.01 componentes/día y con este valor se tienen los
parámetros de la población .
100 días y .
100 días. Con la distribución de con una muestra de 100 componentes calculemos la probabilidad de que esté comprendida dentro del intervalo 5 días.
95 105 Φ√
Φ√
Φ 0.5 Φ 0.5
0.6915 0.3085 0.383
Si 0.05 se tiene .
20 y √
2 días, y la probabilidad es
15 25 Φ25 20
2 Φ15 20
2 Φ 2.5 Φ 2.50.9938 0.0032 0.9876
15.3.1.2 Muestreo de poblaciones pequeñas
√ (15.15)
Como regla el factor de corrección se usa cuando el tamaño de la muestra excede el
10% de tamaño de la población. Ejemplo 15. 6 Si en la Facultad de Ingeniería se graduaron 175 ingenieros petroleros
en el año 2009, de ellos solamente 100 entrarán a trabajar en la industria petrolera, de los cuáles a 10 se les convocará para estimar el salario inicial que percibirán todos los ingenieros de esta especialidad. Si la desviación estándar de la población es $5,000, el error estándar es
√
$ ,√
$1,507.56
Y la probabilidad de que esté comprendida dentro del intervalo de $2,000 de
$6,000 es
376 | C a p í t u l o 1 5 L o s E s t a d í s t i c o s y s u s D i s t r i b u c i o n e s
6,000 2,000 6,000 2,000 Φ8,000
1,507.56 Φ 4,000
1,507.56Φ 5.30 Φ 2.65 1 0.0040 0.9960
15.3.2 Distribución muestral de la diferencia de medias ‐ ‐ Existen situaciones en las que el trabajo estadístico consiste en estudiar la
diferencia entre dos medias; por ejemplo cuando se analiza la diferencia en las tasas de producción de dos procesos industriales, la diferencia en la operación de dos tipos de seguros, la diferencia en la aprobación de los alumnos de dos grupos escolares o bien la diferencia en las condiciones de salud de pacientes que se tratan con placebos y con cierta droga. La comparación de las dos poblaciones frecuentemente es más útil que el estudio de una sola y el interés primario es el estudio de las medias de las poblaciones.
Sean las poblaciones de interés la 1 y la 2 de las cuáles se sacan muestras aleatorias de tamaños no necesariamente del mismo tamaño, respectivamente; y nuestro interés se centra en la diferencia . Si que continuamos sacando pares de muestras independientes de sendas poblaciones, podemos derivar la distribución muestral de la diferencia entre las dos medias como sigue.
La diferencia entre las medias sacadas de muestras aleatorias independientes es la combinación lineal 1 que, al aplicarle el operador valor esperado y los resultados de la sección previa, se tiene
1
(15.16) Donde y son las medias de las poblaciones 1 y 2, respectivamente. Al
aplicarle el operador Varianza a la combinación lineal tenemos
1 1 1 (15.17) Y conforme los conceptos de la sección anterior, el error estándar de la diferencia
es
(15.8)
Donde y son las varianzas de las poblaciones 1 y 2, respectivamente. Las expresiones de la media y el error estándar de la diferencia entre medias son
válidas independientemente de las poblaciones madre; y, si las distribuciones de estas poblaciones son normales, entonces, la forma de la distribución muestral de la diferencia de medias es también normal. Más aún, si no lo son, conforme al teorema del Límite Central puede decirse que si los tamaños de las muestras tienden a infinito, la distribución muestral de la diferencia de medias se aproxima a la distribución normal independientemente de las formas de las distribuciones madre.
C a p í t u l o 1 5 L o s E s t a d í s t i c o s y s u s D i s t r i b u c i o n e s | 377
Con esta base, si estamos trabajando con dos muestras muy grandes, la forma de las distribuciones de las poblaciones es irrelevante y podemos aproximar la distribución muestral de la diferencia de medias a la distribución normal.
Existe un caso particular cuando las varianzas de las poblaciones son iguales; es decir, ‐o equivalentemente, las desviaciones estándar ‐ en cuyo caso
(15.9)
Hasta aquí hemos considerado que se conocen las varianzas de las poblaciones con
las cuáles podemos calcular el error estándar de la diferencia aplicando las expresiones (15.8) o (15.9); sin embargo si no es el caso debemos estimarlas con las varianzas de las muestras como se verá en el capítulo dedicado a la estimación.
15.3.3 Distribución muestral del estadístico proporción ‐ ‐ En investigaciones que involucran poblaciones con datos cualitativos, el parámetro
de interés principal de la población es la proporción de las unidades experimentales que exhiben un atributo particular. Como hicimos con para generalizar acerca de , lo mismo hacemos con el estadístico para hacer generalizaciones respecto a .
La proporción de la muestra de un atributo se encuentra dividiendo el número de elementos de la muestra que poseen el atributo que se desea estudiar entre el tamaño de la muestra.
(15.10)
Cuando el muestreo es aleatorio e independiente, tiene una distribución
binomial que se aplica cuando los resultados de la muestra vienen de un proceso continuo o el muestreo se hace con remplazo, pero si se hace con remplazo de una población finita se aplica la distribución hipergeométrica; no obstante, en cualquier caso conviene aproximar dichas distribuciones a la distribución normal cuando está cercano a 0.5.
Nuevamente podemos utilizar el teorema del Límite Central para decir que la distribución normal es apropiada para el estadístico . Si el muestro satisface las condiciones de un proceso de Bernoulli en el que cada observación puede representarse por una variable dicotómica la cual toma el valor de 0 si no tiene la característica bajo estudio, o 1 si la observación si satisface dicho criterio; y las probabilidades correspondientes de la observación serán 1 y respectivamente, con lo cual cada observación satisface la distribución de Bernoulli y; como ya vimos en el capítulo 12, la suma de observaciones de Bernoulli se comportan como una distribución Binomial, y la proporción de éxitos ‐el estadístico‐ es igual a la media de de todas las observaciones. En el capítulo 12 mostramos como encontrar probabilidades binomiales usando las
tablas correspondientes usando el tamaño de la muestra y en número de éxitos
378 | C a p í t u l o 1 5 L o s E s t a d í s t i c o s y s u s D i s t r i b u c i o n e s
contenidos en ella, e introducimos la aproximación a la normal que se usa comúnmente en los trabajos estadísticos que involucran proporciones.
Así pues, de la distribución Binomial de se derivan los parámetros generales media y error estándar del estadístico .
(15.11)
(15.12)
Cabe recordar que las desviaciones estándar de las distribuciones muestrales se
llaman errores estándar. Aplicando el la corrección para la continuidad de 0.5 ‐como se vio en el capítulo 12‐ para calcular las probabilidades acumuladas con la aproximación a la distribución normal, se tiene
Φ . ⁄ (15.13)
Ejemplo 15. 7 Si la fabricación de los microcircuitos utilizados en los receptores de
CIRES tienen 5% de defectos y se toma una muestra de 30, calculemos la probabilidad de que la proporción de la muestra sea menor o igual a 0.10.
Para el cálculo de la probabilidad primero necesitamos calcular el error estándar de utilizando la fórmula (15.12) para lo cual 0.05 y 30.
. . 0.0398
Utilizando la expresión (15.13) considerando que 0.10 30 3 microcircuitos
defectuosos, tenemos
0.10 Φ . ⁄ . .
Φ 1.675 0.9530 Cuando se muestrea de poblaciones pequeñas de tamaño , también puede usarse
la aproximación a la normal ajustando el error estándar con el factor de corrección por poblaciones, que puede ignorarse si el tamaño de la población es grande.
(15.14)
15.3.4 Distribución muestral del estadístico Varianza ‐ ‐ En los trabajos estadísticos el interés primario está centrado en hacer inferencias
sobre la(s) media(s) de la(s) población(es) y aunque se calcula la varianza con la(s) muestra(s), no se hacen inferencias a cerca de la varianza de la población; sin embargo existen problemas en los cuáles es necesario enfocarse al comportamiento de la variabilidad de la(s) variable(s); es decir, en el valor de de la población ‐o la
C a p í t u l o 1 5 L o s E s t a d í s t i c o s y s u s D i s t r i b u c i o n e s | 379
desviación estándar ‐ y la tendencia central pasa a un segundo plano; por ejemplo en un análisis químico en el que un método tiene tiempos de reacción consistentes puede ser más deseable que otro que en promedio sea más rápido pero sus tiempos de reacción sean más variables; tales métodos necesitan someterse al estudio de las variaciones de los respectivos tiempos de respuesta de las poblaciones; o bien, si los clientes están consientes del tiempo de espera en las colas que hacen en las ventanillas del banco, pueden disgustarse más por la impredecibilidad del periodo de tiempo que tendrán que esperar para que se les atienda. En tales casos, la variabilidad
es de más interés que la . Así como con los valores de los estadísticos y se hacen inferencias respecto a
los parámetros y de las poblaciones; Ahora veremos como con los valores de la varianza se hacen para la varianza de la población , a partir de su distribución muestral.
Conviene recordar que un estadístico o estimador es una función de una muestra aleatoria que no contiene parámetros; con esto en mente definimos al estadístico varianza, que se denota con como
∑
(15.15)
Es importante hacer notar que en lugar de la expresión anterior, muchos libros de
estadística la definen de la siguiente forma
∑ (15.16)
Sin aclarar que esta última expresión corresponde a la varianza insesgada como lo
demostraremos en el capítulo dedicado a la teoría de la estimación estadística. Antes de derivar la distribución muestral del estadístico varianza, es conveniente
establecer otra forma más sencilla de calcularla, sin omitir que a partir de los datos de la muestra las calculadoras o computadoras arrojan los valores de éste y muchísimos estadísticos más; sin embargo, como se habrá observado y se observará a lo largo del libro, mi anhelo es que sea de utilidad para los estudiantes de cualquier licenciatura en la que la probabilidad y estadística es indispensable para contribuir a su sólida formación profesional, y puedan interpretar apropiadamente los valores que arrojan las computadoras o calculadoras cuando se alimentan con los datos. Como les digo a mis alumnos, hay personas que usan la cabeza y hay quienes usan la computadora; mi interés consiste en saber como bailan los enanitos que están dentro de las computadoras para hacer un análisis correcto de los resultados. He tenido experiencias en las cuáles los resultados de las computadoras arrojan probabilidades negativas o mayores que 1, y las personas dicen “este fue el resultado que me dio la computadora” sin tener las bases para saber que estos resultados son absurdos.
Derivemos la otra forma de calcular la varianza a partir de la expresión (15.15), primero desarrollando el binomio y después aplicando el operador sumatoria y efectuando el cociente.
2
380 | C a p í t u l o 1 5 L o s E s t a d í s t i c o s y s u s D i s t r i b u c i o n e s
∑ 2 ∑ 2 ∑ ∑
∑ ∑ ∑ ∑ 2 ; con lo cual
∑
(15.16)
Esta nueva expresión de la varianza nos permite calcularla de manera más sencilla
y, como puede observarse es análoga a la varianza de las variables aleatorias estudiada en el capítulo 11.
Para derivar la distribución muestral del estadístico varianza suponiendo que la población de la cual sacamos las muestras tiene una distribución normal y que conocemos el valor de la media . Considerando una sola desviación de tenemos
Elevando al cuadrado esta desviación y desarrollándolo
2 Sumado todas las desviaciones de la media y aplicando el operador sumatoria
2
Como es constante
2
Y, además
2 2 2 0 Se tiene ∑ ∑ Su ahora dividimos entre ∑ ∑
(15.17)
Trabajando con el término del lado izquierdo de la expresión anterior
C a p í t u l o 1 5 L o s E s t a d í s t i c o s y s u s D i s t r i b u c i o n e s | 381
∑ ∑ ∑ (15.18)
En efecto, la suma de variables aleatorias estandarizadas tiene una distribución de
probabilidad como se estableció en el capítulo 13 y en este caso los grados de libertad equivalen al número de elementos de la muestra.
Con esta misma base para el miembro derecho de la parte derecha de (15.17) se tiene
√⁄ (15.19)
Sustituyendo las expresiones (15.18) y (15.19) en (15.17) se tiene
∑
Por la propiedad de aditividad de la distribución Chi‐cuadrada se tiene ∑
(15.20)
Finalmente, si de la definición de varianza establecida en la expresión (15.15)
despejamos ∑ y la sustituimos en la anterior te obtiene que
(15.21)
Por lo que hemos demostrado que si y devienen de una población que se
distribuye normalmente, entonces la relación se distribuye conforme una
distribución Chi‐cuadrada con 1 grados de libertad. Si en lugar de utilizar utilizamos el estimador insesgado ‐ que se calcula con
las expresiones (15.15) y (15.16)‐ se obtiene
(15.22)
Las distribuciones muestrales de las varianzas y son realmente las
distribuciones de
(15.23)
y
(15.24)
Pero usualmente en los trabajos estadísticos sobre inferencias se utilizan los
cocientes dados por las expresiones (15.21) y (15.22) porque son variables Chi‐
382 | C a p í t u l o 1 5 L o s E s t a d í s t i c o s y s u s D i s t r i b u c i o n e s
cuadradas que se encuentran directamente en las tablas correspondientes de estas variables aleatorias, que se vieron en el capítulo 13.
Ejemplo 15.8 Con relación al ejemplo 15.3 en el cual se utilizan medidas
antropométricas para determinar el alcance entre los tableros de control y los operadores, si se toma una muestra de 25 operadores sentados de una población normal y se les mide la distancia efectiva, aunque la varianza de la población se desconoce, los registros de las investigaciones previas sugieren que la varianza de la población es de 4 16 . La probabilidad de que la varianza de la muestra exceda 20 , usando la expresión (15.22), es
20| 16 p1 20 25 1
16 30 De la tablas de la distribución Chi‐cuadrada, para 25, se tienen 25 1
24 g. de l. con lo cual la probabilidad está dentro del intervalo 0.10 20 0.20 Usualmente, los investigadores están más interesados en la desviación estándar
que en la varianza, por lo que en lugar de tratar con la distribución muestral del error estándar, las probabilidades de se obtienen aplicando la distribución Chi‐cuadrada en la evaluación del evento correspondiente de ; así 3 es equivalente a 9 y
5 es equivalente a 25. Ejemplo 15.9 Un criterio usado en espectrometría basada en rayos infrarrojos, es la
densidad de dislocación del cristal del laser. Si interesa más la consistencia en la densidad de dislocación de cristal a cristal que en nivel medio absoluto, para lo cual se desarrolló un experimento con 15 cristales cuyo desplazamiento dio por resultado 530 y 90. Para hacer comparaciones a un cristal cuya desviación estándar se estimó en 150 y se supuso que la desviación estándar ‐o la varianza‐ de la población es la misma para los cristales experimentales; la probabilidad de haber obtenido estos resultados extremos, aplicando la expresión (15.22), es
90| 150 p 5.04
Consultando las tablas de la distribución Chi‐cuadrada, para 15, se tienen
15 1 14 g. de l. se tiene que el valor de 5.04 queda comprendido entre 4.660 y 5.368 que corresponden a los valores 0.99 0.98 de la cola derecha, como la probabilidad solicitada es la de la cola izquierda, aplican las probabilidades complementarias y la probabilidad solicitada estará dentro del rango
0.01 90| 150 0.02
C a p í t u l o 1 5 L o s E s t a d í s t i c o s y s u s D i s t r i b u c i o n e s | 383
En el estudio de la distribución Chi‐Cuadrada vimos que los grados de libertad eran igual al número de las variables aleatorias estandarizas, o sea , pero ahora que estudiamos los estadísticos de las varianzas sesgada e insesgada demostramos que los grados de libertad son 1. Conviene recordar que el concepto de sesgo se estudiará en el capítulo de estimación. Una regla práctica para encontrar los grados de libertad consiste en restar al tamaño de la muestra el número de parámetros que aparecen en la relación que liga al estimador con la variable aleatoria que se necesita para calcular las probabilidades, NO con la expresión que se utiliza para calcular el estimador; puesto que como vimos, ésta no contiene parámetros.
Así, en las expresiones (15.23) y (15.24) aparece el parámetro de la población por lo que los grados de libertad son 1, y en el cálculo de las probabilidades del estadístico se utilizará la distribución Chi‐Cuadrada con parámetros
1 2 1
Con los cuáles es posible hacer la aproximación de la distribución Chi‐Cuadrada a la
distribución normal usando la relación de transformación a la variable aleatoria estandarizada
(15.25)
Cuando el tamaño de la muestra 30 puede usarse la distribución normal para
aproximar la distribución Chi‐Cuadrada. Ejemplo 15.18 Con relación al ejemplo 15.8, si se toma una muestra de 50
operadores sentados de una población normal y se les mide el alcance efectivo, se puede utilizar la aproximación a la normal puesto que la muestra es mayor que 30 con
50 1 49 g. de l. para calcular la probabilidad solicitada.
20| 16 p1 20 49
16 61.25
Cabe observar que este valor no se encuentra en las tablas, por lo tanto usamos la
aproximación a la distribución normal con la ecuación (15.25)
20| 16 61.25 49
2 491.237 1 Φ 1.237
1 0.8907 0.1093 Aunque la varianza de la población se desconoce, los registros de las investigaciones
previas sugieren que la varianza de la población es de 4 16 . La probabilidad de que la varianza de la muestra exceda 20 , usando la expresión (15.22), es
384 | C a p í t u l o 1 5 L o s E s t a d í s t i c o s y s u s D i s t r i b u c i o n e s
20| 16 p1 20 25 1
16 30 De la tablas de la distribución Chi‐cuadrada, para 25, se tienen 25 1
24 g. de l. con lo cual la probabilidad está dentro del intervalo 0.10 20 0.20 Cabe observar que en este capítulo hemos considerado que se conocen los
parámetros de la población, lo cual generalmente no ocurre por lo tanto debemos estimarlos y, buscar las expresiones para calcular las probabilidades que es el objeto de la teoría de la estimación que se estudiara en un capítulo posterior.
15.3.5 Distribución muestral del estadístico cociente de dos Varianzas ‐ ‐
Si se muestrea de dos poblaciones etiquetadas con 1 y 2 que se distribuyen normalmente con varianzas , cuyos tamaños de las muestras son y no necesariamente del mismo tamaño respectivamente, y calculamos el cociente de la ecuación (15.22) que contiene el estadístico varianza, se tiene
1
1 ,
Este cociente es igual al cociente de dos variables aleatorias , que corresponde a
la definición de la variable aleatoria con 1 y 1 grados de libertad en el numerador y en el denominador, respectivamente; que estudiamos en el capítulo de las distribuciones aleatorias continuas. Por lo tanto, al cociente de los estadísticos varianza se le llama estadístico .
Ejemplo 15.19 Si Para estudiar dos tratamientos diferentes que se aplican a los
pacientes de cierta enfermedad, se dividen a los pacientes en las poblaciones 1, los que reciben el tratamiento 1 y 2, a los que se les aplica el tratamiento 2. Si de las poblaciones se sacan muestras de tamaños 16 y 11, los g. de l. asociados a las varianzas son 16 1 15 y 11 1 10, y el cociente tiene
15 g. de l. en el numerador y 10 g. de l. en el denominador; si el valor del estadístico fuese 3.25, consultando las tablas de la distribución se tiene que dicho valor está comprendido entre los fractiles 0.95 ‐para el cual 2.85‐ y 0.975 ‐donde 3.52‐, lo que significa que el valor de 3.25 se encuentra en el rango 0.05 a 0.025 de la cola derecha de la distribución.
Cabe observar que en este capítulo hemos considerado que se conocen los
parámetros de la población, pero como generalmente no ocurre en las investigaciones estadísticas, debemos estimar estos parámetros a partir de los datos de las muestras y
C a p í t u l o 1 5 L o s E s t a d í s t i c o s y s u s D i s t r i b u c i o n e s | 385
buscar las expresiones para calcular las probabilidades necesarias; y este es el objeto de la teoría de la estimación que se estudiara en un capítulo posterior.
15.4 Bibliografía y referencias Lapin L. (1983) PROBABILITY AND STATISTICS FOR MODERN ENGINEERING,
Brooks/Cole Engineering Division Monterey California USA. Winkler R. & Hays W. (1975), Statistics, PROBABILITY, INFERENCE, AND DECISION,
HOLT, RINEHART AND WINSTON, Second Edition, USA. Johnson N. Leone F. (1977), Statistics and Experimental design, in Engineering and
Physical Sciences, Vol. I, Second Edition, John Wiley &. USA. Hines W. Montgomery D. (1980), PROBABILITY AND STATISTICS IN ENGINEERING
AND MANAGEMENT SCIENCE, 2nd. ED., John Wiley & Sons, Canadá.
Nombre de archivo: CAPÍTULO 15 LOS ESTADÍSTICOS Y SUS DISTRIBUCIONES.docx Directorio: C:\Documents and Settings\bfc\Mis documentos\g‐1)
Capítulos de mi libro de Probabilidad y estadística 2007‐2009 Plantilla: C:\Documents and Settings\bfc\Datos de
programa\Microsoft\Plantillas\Normal.dotm Título: Asunto: Autor: fACULTAD DE INGENIERÍA Palabras clave: Comentarios: Fecha de creación: 05/01/2010 21:35:00 Cambio número: 42 Guardado el: 25/06/2010 20:10:00 Guardado por: FACULTAD DE INGENIERÍA Tiempo de edición: 1,978 minutos Impreso el: 30/08/2010 13:09:00 Última impresión completa Número de páginas: 21 Número de palabras: 7,562 (aprox.) Número de caracteres: 41,591 (aprox.)