26
ESCUELA SUPERIOR DE CONTADURÍA Y ADMINISTRACIÓN INCORPORADA A LA UNIVERSIDAD AUTÓNOMA DE COAHUILA ENSAYOS DE HIPÓTESIS DE UNA Y DOS COLAS CON MEDIAS Y PROPORCIONES Ing. José Santos Calvillo Daniel Nueva Rosita, Coah. Agosto 2014

Ensayos de hipótesis de una y dos colas con medias y proporciones

Embed Size (px)

Citation preview

Page 1: Ensayos de hipótesis de una y dos colas con medias y proporciones

ESCUELA SUPERIOR DE CONTADURÍA Y ADMINISTRACIÓN

INCORPORADA A LA UNIVERSIDAD AUTÓNOMA DE COAHUILA

E N S AY O S D E H I P Ó T E S I S D E U N A Y D O S C O L A S

C O N M E D I A S Y P R O P O R C I O N E S

Ing. José Santos Calvillo Daniel

Nueva Rosita, Coah. Agosto 2014

Page 2: Ensayos de hipótesis de una y dos colas con medias y proporciones

INTRODUCCIÓN

El ensayo o prueba de hipótesis es una teoría de la decisión estadística que permite determinar si una afirmación acerca del valor de un parámetro poblacional debe ser o no rechazada, basada en la estadística inferencial que estudia como sacar conclusiones para toda una población a partir del estudio de una muestra y el grado de fiabilidad o significación de los resultados obtenidos, por ello, la muestra debe ser representativa; es decir, que no sea muy pequeña y refleje lo más posible las características de la población a estudiar.

En un ensayo de hipótesis se estudia la validez de una inferencia o que se hace sobre algún aspecto de una distribución de probabilidad.

Ing. José Santos Calvillo Daniel

Page 3: Ensayos de hipótesis de una y dos colas con medias y proporciones

PROCEDIMIENTO PARA LA REALIZACIÓN DE ENSAYOS DE HIPÓTESIS

Al realizar ensayos de hipótesis, se parte de un valor supuesto o parámetro poblacional hipotético. Después de recolectar una muestra aleatoria, se compara la estadística muestral, así como la media, con el parámetro hipotético, se compara con una supuesta media poblacional. Después se acepta o se rechaza el valor hipotético, según proceda la prueba realizada.

El procedimiento para la realización de este tipo de pruebas o ensayos, puede dividirse en, por lo menos 6 etapas, que van desde la elección del parámetro de interés y planteamiento de las hipótesis nula y alterna, la especificación del nivel de significancia con sus criterios de prueba para ese nivel, la elección del valor estadístico de prueba, hasta la toma de decisión de rechazo o no rechazo de la suposición y sus conclusiones. Dichas etapas pueden concretarse en los siguientes pasos

Ing. José Santos Calvillo Daniel

Page 4: Ensayos de hipótesis de una y dos colas con medias y proporciones

PASOS PARA ELABORAR UN ENSAYO DE HIPÓTESIS

1. Identificar el parámetro de interés y describirlo en el contexto de la situación del problema.

2. Establecer la hipótesis nula (afirmación que inicialmente se supone cierta) y su

hipótesis alterna (afirmación contradictoria a y que es donde cae el peso de la

prueba). 3. Establecer nivel de significancia y criterios de prueba; es decir, después de

establecer nivel de significancia, se debe precisar la región de rechazo a ese nivel. A esta área se le llama región crítica α, por lo que la complementaria de no rechazo (1 – α).

Se acostumbra determinar la región crítica examinando la gravedad del error tipo I y simbolizarlo por α. Si es de suma gravedad o muy costoso, el valor de α debe ser bajo, quizá de 0.01; si no es tan grave, se acostumbra usar un α de 0.05; y este nivel de riesgo, está bajo el control del tomador de la decisión. Aceptar cuando es falsa se considera un error tipo II.

Ing. José Santos Calvillo Daniel

Page 5: Ensayos de hipótesis de una y dos colas con medias y proporciones

4. Se determina o formula el valor estadístico del ensayo.

1) conocido, población normal, no importa tamaño muestral (caso ideal)

Estadístico z = N(0, 1) Distribución normal = 0 y = 1

2) conocido o no, población no importa si es o no normal, tamaño muestral .

Estadístico z = N(0, 1) ó z = N(0, 1) con s

3) desconocido, población normal, tamaño muestral, Estadístico T = (Student con n-1 grados de

libertad)

Ing. José Santos Calvillo Daniel

Page 6: Ensayos de hipótesis de una y dos colas con medias y proporciones

Otra forma de representar la llamada Distribución T de <<Student>> es a través de la variable Ŝ que simboliza la estima muestral de desconocida, que es aproximadamente igual a la desviación estándar (s) de la muestra

Estadístico T = y Ŝ = s

Entonces T = donde (s) es la desviación estándar

* Cuando “n” aumenta hasta 30 o más, ambos métodos tienden a coincidir; es decir, = y T = Z (En este caso la variable T se convierte en la variable tipificada Z con su valor estadístico para muestras grandes). La distribución T se usará solamente junto con el T.C.L. en los casos donde no se conozca (desviación estándar poblacional).

Ing. José Santos Calvillo Daniel

Page 7: Ensayos de hipótesis de una y dos colas con medias y proporciones

4) El valor del estadístico “z”, para muestras grandes y proporción P. Aquí S = , la probabilidad de éxitos en una muestra; = = p, donde p es la proporción de éxitos en la población y n es el tamaño de la muestra.

= , donde q = 1 – p. El valor de z viene dado por:

Estadístico z = = X/n

Donde X es el número real de éxitos en una muestra, z se convierte en:

z = ; Es decir, = = np; = y S = X

*Los casos 2, 3 y 4 son los más realistas en este tipo de pruebas.

Ing. José Santos Calvillo Daniel

Page 8: Ensayos de hipótesis de una y dos colas con medias y proporciones

5. Se toma la decisión de rechazar o no la hipótesis nula probada.

Si el valor del estadístico queda dentro de la región crítica α, es preciso rechazar la hipótesis nula, lo cual a su vez significa “aceptar” la hipótesis alterna(1 – α); y viceversa, si no queda dentro de la región crítica, la decisión será “no rechazar” la hipótesis nula y concluir que tal hipótesis es cierta.

Cuando se trabaja con muestras, siempre es posible cometer alguno de estos errores, independientemente del nivel de significación elegido y su consecuente región crítica o de rechazo para la hipótesis nula, lo cual se resume en la tabla adjunta siguiente (Fig. 1):

Decisión es verdadera es falsa

No rechazar No hay error Error tipo II

Rechazar Error tipo I No hay errorFig. 1

Ing. José Santos Calvillo Daniel

Page 9: Ensayos de hipótesis de una y dos colas con medias y proporciones

6. Se llega a una conclusión donde se describe verbalmente la interpretación que se hace de la decisión tomada.

Esta etapa de la prueba de hipótesis es la más significativa, ya que con ello es posible inferir que los resultados experimentales (de la media muestral) observados, contradicen o no la suposición de la media poblacional planteada.

A continuación se esbozarán las gráficas de las pruebas de cola inferior, de cola superior y de dos colas (Ver fig. 2), y se dilucidarán los conceptos tratados mediante algunos ejemplos con medias poblacionales y proporciones, con su correspondiente determinación de niveles de significación adecuados.

Ing. José Santos Calvillo Daniel

Page 10: Ensayos de hipótesis de una y dos colas con medias y proporciones

GRÁFICOS PRUEBAS DE UNA Y DOS COLAS

Prueba de cola inferior Prueba de cola superior Prueba de 2 colas

Tabla 1 Valores para 1 y 2 colas y niveles de significancia 0.05 y 0.01

Nivel de significación 0.05 0.01

Valores críticos de z para ensayos de una cola 1.645 2.33

Valores críticos de z para ensayos de dos colas 1.96 2.58

1 – 1 – 1 – −𝒛𝜶 +𝒛𝜶 −𝒛𝜶/𝟐 +𝒛𝜶/𝟐𝝁𝟎 𝝁𝟎 𝝁𝟎

Ing. José Santos Calvillo Daniel

Fig. 3

Page 11: Ensayos de hipótesis de una y dos colas con medias y proporciones

Signo en la hipótesis alterna

Tipo o región crítica

Una región, lado izquierdo

Dos regiones, una a cada lado

Una región, lado derecho

En resumen, si la hipótesis alterna contiene un signo de menor que ) o mayor que la región crítica se sitúa, por completo, en uno de los lados con el signo “apuntando” hacia el lado en que está la región crítica; si la hipótesis alterna contiene los dos signos, se escribirá con un signo de desigualdad y la región crítica estará dividida en dos partes iguales, una a cada lado; aquí se tiene un ensayo o prueba de dos colas

Tabla 2: Región crítica para ensayos unilaterales o bilaterales (una o dos colas)

Ing. José Santos Calvillo Daniel

Page 12: Ensayos de hipótesis de una y dos colas con medias y proporciones

Ejemplo No. 1 Se estima que el peso medio de los alumnos de la ESCA es de 145 libras. La desviación estándar es de 12 libras. Para probar esa hipótesis se obtuvo una muestra de 40 alumnos del total que asisten a la Escuela, determinándose un peso promedio de 139.5 Lbs. Probar dicha hipótesis con un nivel de significancia α = 0.05

Formulación:

Paso 1: Parámetro de interés

Paso 2: Plantear la Hipótesis nula y alterna :

= = 145 (Peso medio verdadero poblacional)

: 145 (Peso de la prueba).

Paso 3: Establecer Nivel de significancia y criterios de prueba α = 0.05 (Los valores críticos de x pueden obtenerse de la tabla de áreas bajo la curva normal tipificada; y en este caso, la hipótesis alterna sugiere una región crítica de 2 colas, con α/2= 0.25 de área por cada lado. (Ver fig. 4)

EJEMPLOS DE ENSAYOS CON MEDIAS Y PROPORCIONES

Ing. José Santos Calvillo Daniel

Page 13: Ensayos de hipótesis de una y dos colas con medias y proporciones

Región de rechazo

Región de rechazo

𝝁𝟎

(1-=

Fig. 4

Los valores críticos + 1.96 y – 1.96 se obtienen de la tabla de áreas bajo la curva normal tipificada z, con (1 - = 0.95: = 0.475 para cada lado, y arroja el punto 1.96 a la derecha de ; y por simetría, - 1.96 en la parte izquierda de la misma. (Ver tabla 1 fig. 3)

Ing. José Santos Calvillo Daniel

Page 14: Ensayos de hipótesis de una y dos colas con medias y proporciones

Paso 4. Determinar el valor estadístico de prueba. Se trata de un estadístico z con , con un tamaño muestral grande decir, n (aplica el T.C.L.). Caso 2b

z = N(0, 1) = 139.5, = = 145, = 12 lbs y n = 40

z = = - 2.89 ; y por simetría, + 2.89 ; z

Paso 5. Se toma la decisión. Se rechaza porque el valor crítico o del estadístico queda dentro de la región de rechazo ( < < -1.96 y > > +1.96).

Paso 6. Conclusión: Se rechaza la hipótesis nula porque los resultados experimentales de la media muestral observados contradicen la suposición de la media poblacional planteada, y no es significativa en el valor pedido de 0.05; ni siquiera para el valor 0.01 porque sus valores críticos se manejan entre 2.58 (Ver Tabla 3, Áreas bajo la curva normal tipificada Fig. 5).

Ing. José Santos Calvillo Daniel

Page 15: Ensayos de hipótesis de una y dos colas con medias y proporciones

Fig. 5

Ing.

Jos

é S

anto

s C

alvi

llo D

anie

l

Tabla 3 Áreas bajo la curva normal tipificada de 0 a z

Page 16: Ensayos de hipótesis de una y dos colas con medias y proporciones

Tabla 4 Distribución T de Studdent ,una y dos colas, con su probabilidad P

Ing.

Jos

é S

anto

s C

alvi

llo D

anie

l

Fig. 6

Page 17: Ensayos de hipótesis de una y dos colas con medias y proporciones

Ejemplo No. 2 . Hallar la probabilidad de obtener entre 40 y 60 caras, inclusive, en 100 lanzamientos de una moneda.

Formulación: (En este caso se utiliza la aproximación normal de la distribución binomial, la cual es más exacta con muestras grandes con n).

Caso 4 (Tamaño muestral grande n30, usando proporciones)

= np = 100(½) = 50 y = = = 5

En una escala continua, entre 40 y 60 caras significa encontrar la probabilidad de p(x) = p ( x b) = p( 39.5 60.5)

= 39.5 = = = - 2.10

= 60.5 = = = + 2.10

Solución: p ( - 2.10 z + 2.10) = p( 1 - ) = Región de “aceptación” o de no rechazo en una prueba de 2 colas. (Ver figura 7)

Ing. José Santos Calvillo Daniel

Page 18: Ensayos de hipótesis de una y dos colas con medias y proporciones

39.5 60.5

96.42%

Fig. 7

Conclusión:La probabilidad pedida es igual al área bajo la curva normal entre los valores z = - 2.10 y z = + 2.10 = 2 veces el área entre = 0 y = 2.10 = 2(0.4821) = 0.9642; es decir, p( x (Ver Tabla 3, Áreas bajo la curva normal tipificada fig. 5).

Ing. José Santos Calvillo Daniel

Page 19: Ensayos de hipótesis de una y dos colas con medias y proporciones

Ejemplo No. 3. Un fabricante afirma que al menos el 95% de los equipos que suministra a una factoría cumple con las especificaciones requeridas. Un examen sobre una muestra de 200 de tales equipos reveló que 18 eran defectuosos. Probar esa afirmación del fabricante al nivel de significación del 0.05

Formulación:

Paso 1. Determinar parámetro de interés: p

Paso 2. Expresar la hipótesis nula y alterna en términos del parámetro de interés: = ; = 0.95 calidad aceptable

= ; = 0.94 calidad no aceptable

Paso 3. Establecer Nivel de significancia y criterios de prueba α = 0.05 (Los valores críticos de x pueden obtenerse de la tabla de áreas bajo la curva normal tipificada; y en este caso, el signo de la hipótesis alterna sugiere una región crítica del lado izquierdo - 1.645 (Prueba de cola inferior). (Ver fig. 8)

Ing. José Santos Calvillo Daniel

Page 20: Ensayos de hipótesis de una y dos colas con medias y proporciones

Fig. 8=

El valor crítico - 1.64, y con mayor exactitud -1.645, se obtiene de la tabla de áreas bajo la curva normal tipificada z que va de = 0.45 + 0.5 = 0.95, por ser ensayo unilateral o de cola inferior = (1 – α). (Ver también Tabla 2, Región crítica para ensayos unilaterales o bilaterales)

Ing. José Santos Calvillo Daniel

Page 21: Ensayos de hipótesis de una y dos colas con medias y proporciones

Paso 4. Determinar el valor estadístico de prueba. Se trata de un estadístico con P y p, con un tamaño muestral grande n (Aplica el T.C.L.). Caso 4

= X/n = = 0.41

Valor Estadístico z = = = - 2.27

Paso 5. Se toma la decisión. Se rechaza para este nivel de significancia porque = 1.645 del estadístico queda dentro de la región de rechazo en este ensayo unilateral o de cola inferior (z < ,

- 2.27 < -1.645). (Ver Tabla 1 )

Paso 6. Conclusión: Se rechaza la hipótesis nula porque los resultados experimentales observados contradicen la afirmación del fabricante , y no es significativa en el valor pedido de 0.05; ni siquiera para el valor 0.01 porque sus valores críticos se manejan entre +2.33 y – 2.33 (Ver Tabla 1 Fig. 3 Valores para niveles 0.05 y 0.01, una y dos colas).

Ing. José Santos Calvillo Daniel

Page 22: Ensayos de hipótesis de una y dos colas con medias y proporciones

Ejemplo No. 4 La cámara de comercio de Rochester señala que, de acuerdo a un estudio publicado por Rochester Democrat and Chronicle el 21 de febrero de 1972, sobre la contaminación del aire en la ciudad de Chicago, “El nivel medio de dióxido de carbono de contaminación atmosférica no sobrepasa de 4.9”. Para probar esta hipótesis, se toman 25 lecturas aleatorias para las cuales = 5.1 y s = 2.1. Se usa

Formulación:

Paso 1: Determinar parámetro de interés:

Paso 2: Determinar hipótesis nula y alterna en función del parámetro de interés en el contexto del problema: y

Paso 3: Establecer Nivel de significancia y criterios de prueba α = 0.05 (Los valores críticos de t pueden obtenerse de la tabla de distribución t de Studdent; y en este caso, el signo de la hipótesis alterna sugiere una región crítica del lado derecho con (n -1) gL (24) que de acuerdo a la Tabla 4 de Studdent, para 0.05 y 24 gl = 1.71, tal y como se muestra en el gráfico adjunto Fig. 9. (Ver tabla 4 Fig. 6 de Studdent)

Ing. José Santos Calvillo Daniel

Page 23: Ensayos de hipótesis de una y dos colas con medias y proporciones

El valor crítico +1.71, se obtiene de la tabla de valores críticos de distribución t de Studdent con (n – 1) gl; es decir (25 – 1) = 24, que se encuentra a la derecha, de acuerdo al signo de la hipótesis alterna (Ver Tabla 4 de la Distribución t de Studdent con n -1 grados de libertad)

t 0 1.71

Ing. José Santos Calvillo Daniel

Fig. 9

Page 24: Ensayos de hipótesis de una y dos colas con medias y proporciones

Paso 4. Determinar el valor estadístico de prueba. Se trata de un estadístico de variable t de Studdent, con n < 30 y (n – 1) grados de libertad, de cola superior, con y población normal (no aplica el T.C.L.)

T = = = = 0.47

Paso 5. Se toma la decisión. No se rechaza para este nivel de significancia, porque de acuerdo al estudio experimental ;

047 < 1.71; por lo tanto, se encuentra dentro de la región de “aceptación”

Paso 6. Conclusión. No se puede concluir que el nivel medio de carbono sea mayor que 4.9

Ing. José Santos Calvillo Daniel

Page 25: Ensayos de hipótesis de una y dos colas con medias y proporciones

Problemas propuestos

1. Se sabe que las calificaciones obtenidas en un cierto examen se distribuyen normalmente, con una media aritmética de 7.57. Un profesor afirma que si el examinador adopta una actitud agresiva ante los alumnos, el promedio de calificaciones será diferente al establecido. Para probar los anterior, aplicó el examen con una actitud agresiva a 40 alumnos elegidos aleatoriamente y encontró una media aritmética de 7.1 y una desviación estándar de 0.09. Vamos a probar con.

2. El director de una escuela informa que el promedio de minutos empleados a estudiar por todos los alumnos, es de 50 minutos. Sin embargo un profesor considera que el tiempo promedio dedicado a estudiar por todos los alumnos es menor, y escoge una muestra aleatoria de 25 alumnos obteniendo una media aritmética de 42 minutos y una desviación estándar de 7 minutos. ¿Proporciona esta información evidencia suficiente para la consideración del profesor? Use

Ing. José Santos Calvillo Daniel

Page 26: Ensayos de hipótesis de una y dos colas con medias y proporciones

3. El fabricante de una patente médica sostiene que la misma tiene un 90% de efectividad en el alivio de una alergia, por un periodo de 8 horas. En una muestra de 200 individuos que tenían la alergia, la medicina suministrada alivió a 160 personas. Determinar si la aseveración del fabricante es cierta al nivel de significación de 0.01

4. Supóngase que se desea evaluar el aserto de un fabricante que establece que sus llantas radiales tiene un promedio de vida de, por lo menos 40 000 millas. Para probar esta hipótesis se toma una muestra de n = 49, con un valor medio muestral de 38000 millas. Si se sabe que el recorrido de los neumáticos de la población tiene una desviación estándar de 3500 millas, probar la afirmación con un

5. Una muestra aleatoria de 100 muertes registradas en los EE UU durante el año pasado mostró una vida promedio de 71.8 años. Suponiendo una desviación estándar poblacional de 8.9 años, ¿parecería esto indicar que la vida promedio hoy en día es mayor que 70 años?. Use = 0.05

Ing. José Santos Calvillo Daniel