25
UNIVERSIDAD NACIONAL TORIBIO RODRIGUEZ DE MENDOZA – INGENIERIA AGROINDUSTRIAL CONCEPTOS BASICOS A. EL MÉTODO CIENTÍFICO. La investigación se puede definir como un estudio sistemático de un sujeto con el fin de descubrir nuevos hechos o principios. El procedimiento para la investigación es el método científico. la aplicación de la lógica y la objetividad al entendimiento de los fenómenos es la base de la fundamentación del método científico (mc). para el mc es esencial el estudio de lo que ya se conoce, del cual se puede formular hipótesis que se ponen a prueba partiendo por lo general de situaciones experimentales. la estadística juega un papel importante en la fundamentación de mc, tiene tres funciones que son: la descripción, el análisis, y la predicción. En la investigación científica, es común: la formulación de hipótesis cuya aprobación o rechazo, deben estar sustentados por un conjunto de observaciones, las cuales deben seleccionarse a través de un patrón definido. este patrón es el diseño experimental. Una vez definido el tipo de estudio a realizar, la hipótesis; el investigador debe concebir la manera práctica y concreta de responder a las preguntas de investigación, es decir seleccionar o desarrollar un diseño de investigación que puede ser experimental o no experimental. B. INVESTIGACION EXPERIMENTAL: aquella en los que se manipulan deliberadamente las variables en el experimento. EXPERIMENTO. Es una prueba o serie de pruebas en las que se hacen cambios deliberados en las variables de entrada de un proceso o sistema para observar o identificar las razones de los cambios que pudieran observarse en la respuesta de salida ¿QUÉ TIPO DE ESTUDIO ES LA INVESTIGACIÓN EXPERIMENTAL? En Sampieri encontramos 4 tipos de estudios: EXPLORATORIOS, DESCRIPTIVOS, CORRELACIONALES, EXPLICATIVOS. Los estudios explicativos analizan relaciones entre una o más variables independientes, una o más variables dependientes y los efectos causales de las primeras sobre las segundas. CURSO: Métodos Estadísticos de Investigación ALUMNO: Ruiz Yoplac Lord Kelvin CICLO: VIII

Conceptos Basicos y Comparaciones de Medias en Poblaciones Normales

Embed Size (px)

Citation preview

Page 1: Conceptos Basicos y Comparaciones de Medias en Poblaciones Normales

UNIVERSIDAD NACIONAL TORIBIO RODRIGUEZ DE MENDOZA – INGENIERIA AGROINDUSTRIAL

CONCEPTOS BASICOS

A. EL MÉTODO CIENTÍFICO.

La investigación se puede definir como un estudio sistemático de un sujeto con el fin de descubrir nuevos hechos o principios.El procedimiento para la investigación es el método científico. la aplicación de la lógica y la objetividad al entendimiento de los fenómenos es la base de la fundamentación del método científico (mc). para el mc es esencial el estudio de lo que ya se conoce, del cual se puede formular hipótesis que se ponen a prueba partiendo por lo general de situaciones experimentales. la estadística juega un papel importante en la fundamentación de mc, tiene tres funciones que son: la descripción, el análisis, y la predicción. En la investigación científica, es común: la formulación de hipótesis cuya aprobación o rechazo, deben estar sustentados por un conjunto de observaciones, las cuales deben seleccionarse a través de un patrón definido. este patrón es el diseño experimental.Una vez definido el tipo de estudio a realizar, la hipótesis; el investigador debe concebir la manera práctica y concreta de responder a las preguntas de investigación, es decir seleccionar o desarrollar un diseño de investigación que puede ser experimental o no experimental.

B. INVESTIGACION EXPERIMENTAL: aquella en los que se manipulan deliberadamente las variables en el experimento.

EXPERIMENTO. Es una prueba o serie de pruebas en las que se hacen cambios deliberados en las variables de entrada de un proceso o sistema para observar o identificar las razones de los cambios que pudieran observarse en la respuesta de salida

¿QUÉ TIPO DE ESTUDIO ES LA INVESTIGACIÓN EXPERIMENTAL? En Sampieri encontramos 4 tipos de estudios: EXPLORATORIOS, DESCRIPTIVOS, CORRELACIONALES, EXPLICATIVOS. Los estudios explicativos analizan relaciones entre una o más variables independientes, una o más variables dependientes y los efectos causales de las primeras sobre las segundas.

C. LAS INVESTIGACIONES EXPERIMENTALES se pueden considerar del tipo explicativo.

TIPOS DE EXPERIMENTO.

EXPLORATORIOS. Aquellos en el cual el investigador esta interesado en encontrar los factores que tienen influencia sobre las ejecuciones de cierto proceso.

CONFIRMATORIOS. Aquellos en el cual se trata de comparar el “mejor” procedimiento encontrado en el experimento exploratorio con un procedimiento establecido o un producto y “establecer” que el procedimiento o producto nuevo es mejor que el antiguo. En el experimento confirmatorio, se puede querer encontrar el mejor para establecer procesos de control.

CLASES DE EXPERIMENTO. Según el tipo de información que éste produzca, se tiene:

CURSO: Métodos Estadísticos de Investigación ALUMNO: Ruiz Yoplac Lord Kelvin CICLO: VIII

Page 2: Conceptos Basicos y Comparaciones de Medias en Poblaciones Normales

UNIVERSIDAD NACIONAL TORIBIO RODRIGUEZ DE MENDOZA – INGENIERIA AGROINDUSTRIAL

CUALITATIVO. Es aquel para el cual, las mediciones de las variables respuesta se hacen en escala nominal u ordinal. Se usa las estadística no paramétrica.

CUANTITATIVO. Es aquel en que las mediciones se hacen en una escala de razón e intervalo. Se usa la estadística paramétrica.

MIXTOS. Si algunas variables son cuantitativas y otras cualitativas.

D. INVESTIGACIÓN NO EXPERIMENTAL. Aquellos que se realizan sin manipular deliberadamente las variables independientes. Se basa en eventos o sucesos, hechos que ya ocurrieron o se dieron en la realidad sin intervención directa del investigador. Se le conoce como investigación EXPOST-FACTO (los hechos ya ocurrieron y ya existe datos para las variables en estudio) y observa variables y relaciones entre ellas en su contexto natural. Se divide en:

ESTUDIOS TRANSECCIONALES. Realizan observaciones en un momento único en el tiempo. Se divide en:

DESCRIPTIVOS: Miden las variables de manera individual y reportan esas mediciones CORRELACIONALES: Describen relaciones entre las variables CORRELACIONALES/CAUSALES: Establecen procesos de causalidad entre las variables.

ESTUDIOS LONGITUDINALES. Realizan observaciones en dos o más momentos o puntos en el tiempo. Se dividen en:

ESTUDIOS DE TENDENCIA: Si estudian una población ESTUDIO DE ANÁLISIS EVOLUTIVO DE GRUPO: Si analiza una subpoblación o grupo

específico. ESTUDIOS DE PANEL: Si se estudian a los sujetos

E. DISEÑO EXPERIMENTAL.

Se entiende por diseño experimental, al proceso de planear un experimento, tal que se tomen datos apropiados con la mayor realidad posible, los cuales deben ser analizados mediante métodos estadísticos que deriven conclusiones válidas y objetivas; con una alta fidelidad y a un costo mínimo.

CARACTERISTICAS DEL DISEÑO EXPERIMENTAL.

SIMPLICIDAD. Selección de tratamientos y disposición experimental lo más simple posible. GRADO DE PRECISIÓN. Capacidad para medir diferencias entre tratamientos con los

grados de precisión que el investigador desea. El número de repeticiones y el diseño deben ser adecuados.

AUSENCIA DE ERROR SISTEMÁTICO. Procurar una estimación insesgado del efecto de tratamientos.

RANGO DE VALIDÉZ DE LAS CONCLUSIONES. El diseño deberá ser tan amplio posible, como los experimentos replicados y experimentos con estructuras factoriales.

CURSO: Métodos Estadísticos de Investigación ALUMNO: Ruiz Yoplac Lord Kelvin CICLO: VIII

Page 3: Conceptos Basicos y Comparaciones de Medias en Poblaciones Normales

UNIVERSIDAD NACIONAL TORIBIO RODRIGUEZ DE MENDOZA – INGENIERIA AGROINDUSTRIAL

CÁLCULO DEL GRADO DE INCERTIDUMBRE. El experimento debe ser concebido de modo que sea posible calcular la probabilidad de obtener los resultados observados debido únicamente al azar.

EL DISEÑO EXPERIMENTAL: Es un plan usado en la distribución de los tratamientos a las unidades experimentales, teniendo en cuenta ciertas restricciones, como la aleatorización, con fines de disminuir el ERROR EXPERIEMNTAL.

CLASES DE DISEÑO EXPERIMENTAL: Se clasifica según el objetivo del diseño, “estudiar uno o más factores (variables independientes).

EXPERIMENTOS SIMPLES: (de un solo factor). Parcelas apareadas Parcelas no apareadas o grupos sorteados o grupos sorteados (2 tratamientos) Diseño completamente al azar (DCA) Diseño en bloque completamente al azar (DBCA) Diseño cuadrado latino (DCL) Diseño cuadrado grecolatino Diseño cuadrado modificado

EXPERIEMENTO FACTORIAL: (de 2 ó más factores)

Bifactoriales, trifactoriales, etc en DCA, en bloques, cuadrado latino, etc. Confusión Parcelas divididas Clasificación anidada

PASOS DE UNA INVESTIGACIÓN EXPERIMENTAL

CURSO: Métodos Estadísticos de Investigación ALUMNO: Ruiz Yoplac Lord Kelvin CICLO: VIII

Page 4: Conceptos Basicos y Comparaciones de Medias en Poblaciones Normales

UNIVERSIDAD NACIONAL TORIBIO RODRIGUEZ DE MENDOZA – INGENIERIA AGROINDUSTRIAL

DEFINICIONES PRINCIPALES:

FACTOR. Es una variable explicativa independiente de tipo cualitativo y cuantitativo. También puede ser definido como: el elemento, material o cualquier procedimiento sometido a estudio o ha ensayos de comparación sobre el cual el investigador tiene conocimiento y es de su interés estudiarlo. EJEMPLO:

Tipo de sustrato Tamaños de poda Sistema de riego Tipos de poda Densidad de plantación Tipos de herbicídas Temperatura Tiempo

Alimentación Presentación de un producto Sistemas de enseñanza Formas de elaborar u producto Terapia en determinada enfermedad

NIVEL DE FACTOR O TRATAMIENTO Es una de las categorías de la variable explicativa (factor). Es también parte elemental o “dosis” de un factor cuyo efecto se mide o se evalúa y se compara con otros niveles del mismo factor.

El término tratamiento en Estadística es utilizado ampliamente para designar a cada uno de los niveles de un factor (experimentos simples) o también para designar a cada una de las combinaciones de los niveles de dos o más factores (experimentos factoriales).

Tratamiento Testigo Es un tratamiento especial del experimento (tratamiento local, original) sirve como base de comparación de los nuevos tratamientos o Variedades introducidas. Ejemplo:

CARACTERÍSTICA O VARIABLE RESPUESTA

Es la característica a través de la cual se evalúa el efecto de cada uno de los niveles del factor en estudio, para lo cual se debe disponer del material experimental adecuado.

Ejemplos: Rendimiento en kilos de papa (cuantitativa) Sabor de la mermelada de tomate (escala hedónica de 5 puntos) (cualitativa) altura de planta, rendimiento, número de semillas, ancho de hoja, diámetro de tallo, etc.

CURSO: Métodos Estadísticos de Investigación ALUMNO: Ruiz Yoplac Lord Kelvin CICLO: VIII

Page 5: Conceptos Basicos y Comparaciones de Medias en Poblaciones Normales

UNIVERSIDAD NACIONAL TORIBIO RODRIGUEZ DE MENDOZA – INGENIERIA AGROINDUSTRIAL

EXPERIMENTOS SIMPLES CON DOS TRATAMIENTOS

A. COMPARACION DE MEDIAS DE DOS POBLACIONES NORMALES INDEPENDIENTES DE VARIANZAS CONOCIDAS.

Sean X1 ,X2, X3, …Xn una muestra aleatoria, seleccionada de una población N(µ1, σ21) y Sean Y1 ,Y2, Y3,

…Yn una muestra aleatoria, seleccionada de una población N(µ2, σ22). Supongamos que las

poblaciones son independientes y con medias maestrales:X y Y .

Pasos UNILATERAL HACIA LA DERECHA

UNILATERAL HACIA LA IZQUIERDA

BILATERAL

Plantear las Hipótesis:

Ho: μ1≤μ2

Ha: μ1¿ μ2¿

Ho: μ1≥μ2

Ha: μ1¿¿

Ho: μ1=μ2

Ha: μ1≠μ2

nivel de Significancia α = 0.01 o 0.05.Asocia a Zα=…

Estadística de prueba Z=

X1−X2

√ σ12

n1

+σ2

2

n2

≈η(0,1)

Decisión Rechazamos Ho SiZc > Zα ,

Rechazamos Ho SiZc < - Zα

Rechazamos Ho Si Zc > Zα/2 o Zc < - Zα/2,

EJERCICIO DE APLICACIÓN:

La cantidad de impurezas presentes en un lote de sustancia química utilizada como materia prima es determinante para evaluar su calidad.Un fabricante que usa dos líneas de producción 1 y 2, hizo un ligero ajuste a la línea 2 con la esperanza de reducir tanto la variabilidad como la cantidad promedio de impurezas de la sustancias química. Muestras aleatorias en cada línea arrojaron las siguientes mediciones.

LINEA N PROMEDIO VARIANZA1 16 3.2 1.042 16 3.0 0.51

¿Los datos aportan suficiente evidencia para concluir que la variabilidad de impurezas del proceso es menor para la línea 2?

A).- Prueba de Hipótesis.

H0: µ1 = µ2

H1: µ1 > µ2

B).- Nivel de Significación

α = 5% de significancia1-α = 95% de confianza.

CURSO: Métodos Estadísticos de Investigación ALUMNO: Ruiz Yoplac Lord Kelvin CICLO: VIII

Page 6: Conceptos Basicos y Comparaciones de Medias en Poblaciones Normales

UNIVERSIDAD NACIONAL TORIBIO RODRIGUEZ DE MENDOZA – INGENIERIA AGROINDUSTRIAL

C).- Estadística de prueba.

Las muestras provienen de poblaciones normales. Son muestras independientes. Varianzas poblacionales conocidas. σ2, σ2 son diferentes.

Z = 0.691

D).- Región Crítica.

E).- Decisión. Zc no es Mayor que Zα entonces no se rechaza H0 por lo tanto se acepta H0

F).- Conclusión. Los datos aportados no son suficiente evidencia para determinar la variabilidad de las impurezas en este proceso de la línea 2

B. COMPARACION DE MEDIAS DE DOS POBLACIONES NORMALES

INDEPENDIENTES DE VARIANZAS DESCONOCIDAS, MUESTRAS PEQUEÑAS (n1 ; n 2 < 30 )

Sean X1 ,X2, X3, …Xn una muestra aleatoria, seleccionada de una población N(µ1, σ21) y Sean Y1 ,Y2,

Y3, ………Yn una muestra aleatoria, seleccionada de una población N(µ2, σ22 ) donde µ1, µ2 , σ2

1 y σ22 ,

son desconocidas. Supongamos que las poblaciones son independientes.

VARIANZAS DESCONOCIDAS PERO IGUALES (σ21 = σ2

2 = σ2)Pasos UNILATERAL HACIA LA

DERECHAUNILATERAL HACIA LA IZQUIERDA

BILATERAL

Plantear las Hipótesis:

Ho: μ1≤μ2

Ha: μ1¿ μ2¿

Ho: μ1≥μ2

Ha: μ1¿¿

Ho: μ1=μ2

Ha: μ1≠μ2

nivel de Significancia α = 0.01 o 0.05. Asocia a tα=…Estadística de prueba t=

X1−X2

√( n1−1 )S12+(n2−1 )S2

2

n1+n2−2( 1n1

+ 1n2

)

≈t(n1+n2−2 )g . l .

Decisión Rechazamos Ho Sit c > t α(n1 + n 2 -2) ,

Rechazamos Ho Sit c < - t α(n1 + n 2 -2) ,

Rechazamos Ho Sit c < - t α/2(n1 + n 2 -2) o t c > t

CURSO: Métodos Estadísticos de Investigación ALUMNO: Ruiz Yoplac Lord Kelvin CICLO: VIII

Z=X1−X2

√ σ12

n1

+σ2

2

n2

≈η(0,1) Z= 3 .2−3. 0

√ 1. 042

16+ 0 . 512

16

≈η(0,1 )

Page 7: Conceptos Basicos y Comparaciones de Medias en Poblaciones Normales

UNIVERSIDAD NACIONAL TORIBIO RODRIGUEZ DE MENDOZA – INGENIERIA AGROINDUSTRIAL

α/2(n1 + n 2 -2),

EJERCICIO DE APICACION.

Deseamos conocer si los vinos de nuestra denominación de origen tienen el mismo contenido alcohólico que los de otra denominación de origen, por ejemplo la de vino borgoña. Se trata de saber si existe una clara diferenciación en los mismos ya que, debido a la proximidad geográfica de ambas regiones, es posible que haya fraudes y se intercambien vinos de ambas dependiendo del mercado de los mismos. La hipótesis de trabajo inicial es entonces ¿Existen diferencias en el grado alcohólico de ambas Denominaciones?En la primera población (tabernero) el grado alcohólico sigue una distribución normal N(μ1, σ1); en la segunda población (borgoña) el grado alcohólico sigue una distribución normal N(μ2, σ2).Los datos obtenidos son los siguientes muestras aleatorias de tamaño n1 = 14 y n2 = 6. Obtenida de forma independiente en ambas denominaciones.

BORGOÑA12.8 12.8 12.5 11.9 12.5 12.1 12.2 12.5 13.0 12.4 12.6 12.2 12.8 13.0X = 12.598 S = 0.338

TABERNERO

13.0 14.0 13.2 13.4 13.2 13.9X = 13.450 S=0.409

A) Hipótesis de Prueba.

H0: µ1 = µ2

H1: µ1 > µ2

B). Nivel de significación

α = 5% de significancia 1-α = 95% de confianza.

C). Estadística de Prueba. Las muestras provienen de poblaciones normales. Son muestras independientes. Varianzas poblacionales desconocidas. σ2, σ2 son supuestamente iguales.

= - 5.256

CURSO: Métodos Estadísticos de Investigación ALUMNO: Ruiz Yoplac Lord Kelvin CICLO: VIII

t=X1−X2

√( n1−1 )S12+(n2−1 )S2

2

n1+n2−2( 1n1

+ 1n2

)

≈t(n1+n2−2 )g . l .

t=12 .598−13 . 450

√(14−1 )O .3382+(6−1 )0 . 4092

14+6−2( 114

+ 16)

≈t(14+6−2)g . l .t

Page 8: Conceptos Basicos y Comparaciones de Medias en Poblaciones Normales

UNIVERSIDAD NACIONAL TORIBIO RODRIGUEZ DE MENDOZA – INGENIERIA AGROINDUSTRIAL

D). Región Crítica

E) Decisión.El valor del estadígrafo de contraste pertenece a la región crítica, por tanto rechazamos la hipótesis nula.

F) Conclusión.El grado alcohólico es significativamente diferente en Perú de los vinos de marca Tabernero y Borgoña.

C. VARIANZAS POBLACIONALES DESCONOCIDAS PERO DISTINTAS (σ21 ≠ σ2

2), MUESTRAS PEQUEÑAS (n1; n 2 < 30)

Pasos UNILATERAL HACIA LA DERECHA

UNILATERAL HACIA LA IZQUIERDA

BILATERAL

Plantear las Hipótesis:

Ho: μ1≤μ2

Ha: μ1¿ μ2¿

Ho: μ1≥μ2

Ha: μ1¿¿

Ho: μ1=μ2

Ha: μ1≠μ2

nivel de Significancia α = 0.01 o 0.05. Asocia a tα=…Estadística de prueba

T=X1−X2

√ S12

n1

+S2

2

n2

≈t(v )g . l .

v=( S1

2

n1

+S2

2

n2)2

( S12

n1)2

n1+1+

( S22

n2)

n2+1

−2

Decisión Rechazamos Ho Sit c > t α(v),

Rechazamos Ho Sit c < - t α(v)

Rechazamos Ho Sit c < - t α/2(v) o t c > t α/2(v),

EJERCICIO DE APLICACIÓN.

El encargado de compras de una cadena de restaurantes tiene que escoger entre dos variedades de arroz A y B. seleccionan dos muestras aleatorias independientes de 10 bolsas de arroz de un kilo de cada tipo de arroz y encuentra los siguientes porcentajes de granos quebrados por kilo.

A: 6 5 6 7 4 7 6 4 3 6X= 5.4 S=1.35B: 7 6 7 9 5 8 7 6 1 8

CURSO: Métodos Estadísticos de Investigación ALUMNO: Ruiz Yoplac Lord Kelvin CICLO: VIII

Page 9: Conceptos Basicos y Comparaciones de Medias en Poblaciones Normales

UNIVERSIDAD NACIONAL TORIBIO RODRIGUEZ DE MENDOZA – INGENIERIA AGROINDUSTRIAL

0 X=7.3 S=1.49

Estimar mediante un intervalo de confianza de 95% la diferencia promedio de porcentaje de granos quebrados por kilo de arroz de las dos variedades. ¿se puede aceptar que no hay diferencia significativa entre las dos medias poblacionales. Suponga que los porcentajes de granos quebrados por kilo. Se supone que las poblaciones son normales con varianzas desconocidas.

A) Hipótesis de Prueba.

H0: µ1 = µ2

H1: µ1 > µ2

B). Nivel de significación

α = 5% de significancia 1-α = 95% de confianza.

C). Estadística de Prueba.

Las muestras provienen de poblaciones normales. Son muestras independientes. Varianzas poblacionales desconocidas. σ2, σ2 son distintas

T= - 2.988836

Encontrando los grados de libertad

V=8.0895

D). Región Crítica

E) Decisión.El valor del estadígrafo de contraste pertenece a la región crítica, por tanto rechazamos la hipótesis nula. Y aceptamos H0

F) Conclusión.

CURSO: Métodos Estadísticos de Investigación ALUMNO: Ruiz Yoplac Lord Kelvin CICLO: VIII

v=( S1

2

n1

+S2

2

n2)2

( S12

n1)2

n1+1+

( S22

n2)

n2+1

−2 v=(1 . 8232

10+ 1.492

10 )2

( 1 . 8232

10 )2

10+1+( 1 . 492

10 )10+1

−2

T=X1−X2

√ S12

n1

+S2

2

n2

≈t(v )g . l . T= 5 . 4−7 .3

√ 1 .352

10+ 1 . 492

10

≈t(v )g . l .

Page 10: Conceptos Basicos y Comparaciones de Medias en Poblaciones Normales

UNIVERSIDAD NACIONAL TORIBIO RODRIGUEZ DE MENDOZA – INGENIERIA AGROINDUSTRIAL

Dado que µ1 - µ2 = 0 pertenece al rango del T de la tabla podemos concluir que µ1 = µ2, por tanto y que si existe diferencia significativa entre estas muestras.

D. COMPARACION DE MEDIAS DE DOS POBLACIONES NORMALES CON VARIANZAS POBLACIONALES DESCONOCIDAS. MUESTRAS GRANDES (n2; n 2 ≥ 30)

Pasos UNILATERAL HACIA LA DERECHA

UNILATERAL HACIA LA IZQUIERDA

BILATERAL

Plantear las Hipótesis:

Ho: μ1≤μ2

Ha: μ1¿ μ2¿

Ho: μ1≥μ2

Ha: μ1¿¿

Ho: μ1=μ2

Ha: μ1≠μ2

nivel de Significancia α = 0.01 o 0.05. Asocia a Zα=…Estadística de prueba Z=

X1−X 2

√ S12

n1

+S2

2

n2

≈η(0,1 )

Decisión Rechazamos Ho Si Zc > Zα

Rechazamos Ho Si Zc < - Zα

Rechazamos Ho Si Zc > Zα/2 o Zc < - Zα/2,

EJERCICIO DE APLICACIÓN

Para analizar la pulpa de puro puro se ha seleccionado 32 frutos maduros y 32 en estado de sazón de los cuales se realizaron medidas de ºBrix, PH, % acidez, y conocer los valores máximos y mínimos de los parámetros físico- químicos de la pulpa, Para determinar si existe diferencias significativas entre los dos estados de madurez, en caso de existir diferencias no significativas entre los parámetros de ambos estados, no habrá necesidad de trabajar por separado en cada estado de madurez; y en caso de ser significativa la prueba se trabajara con los dos estados por separado

Nº DE REP. SAZÓN MADURO1234567891011

1191111109111111911

7121110910109111011

121314151617181920212223

11121110119111111121213

101191010101110991111

CURSO: Métodos Estadísticos de Investigación ALUMNO: Ruiz Yoplac Lord Kelvin CICLO: VIII

Page 11: Conceptos Basicos y Comparaciones de Medias en Poblaciones Normales

UNIVERSIDAD NACIONAL TORIBIO RODRIGUEZ DE MENDOZA – INGENIERIA AGROINDUSTRIAL

24252627282930

10111112131212

111099121211

3132

1211

1012

∑ Y 352 327VARIANZA 1.097 1.273X 11 10.219

A) Hipótesis de Prueba.

H0: µ1 = µ2

H1: µ1 > µ2

B). Nivel de significación

α = 5% de significancia 1-α = 95% de confianza.

C). Estadística de Prueba.

Las muestras provienen de poblaciones normales. Son muestras independientes. Varianzas poblacionales desconocidas. σ2, σ2 son distintas numero de muestras mayores de 30.

Z= 2.871

D) Región CríticaE) Decisión.El valor del estadígrafo de contraste pertenece a la región crítica, por tanto rechazamos H0. Y aceptamos H1

F) Conclusión.Podemos concluir que µ1 ≠ µ2, por tanto y que no existe diferencia significativa entre estas muestras y por tanto no se trabajara por separado estas muestras.

E. COMPARACION DE MEDIAS DE DOS POBLACIONES NORMALES DEPENDIENTES.

Sean X1 , …Xn una m.a. seleccionada de una población N(µ1 , σ²1) y Y1,…,Yn una muestra aleatoria tomada de una población N(µ2 , σ²2), de modo que las observaciones están pareadas, esto es, la muestra está formada por los pares (X1 , Y1) , (X2 , Y2), ………………,(Xn , Yn. Ahora, definiendo la

CURSO: Métodos Estadísticos de Investigación ALUMNO: Ruiz Yoplac Lord Kelvin CICLO: VIII

Z=11−10. 219

√ 1. 09732

+ 1. 27332

≈η(0,1 )Z=X1−X 2

√ S12

n1

+S2

2

n2

≈η(0,1 )

Page 12: Conceptos Basicos y Comparaciones de Medias en Poblaciones Normales

UNIVERSIDAD NACIONAL TORIBIO RODRIGUEZ DE MENDOZA – INGENIERIA AGROINDUSTRIAL

variable auxiliar D= X-Y. Tenemos la muestra aleatoria de diferencias D1, D2, …., Dn. La variable auxiliar D tiene distribución N(µD , σ²D), donde:

µD = E(D) = E( X-Y) = E(X) – E(Y) = µ1 - µ2 σ²D = Var(D) = Var( X-Y) = σ²1 + σ²2 -2 ρσ1 σ2

ρ = Cov( X,Y) = coeficiente de correlación parcial ≠ 0

La media y la varianza de la muestra de n diferencias D1, D2, ……, Dn es :

D=∑i=1

n

Di

n, SD

2 =∑i=1

n

(Di−D ) ²

n−1 Así, D→ N ( μD ,

σ D2

n)

6.1. Tamaño muestral pequeño (n≤ 30)

Pasos UNILATERAL HACIA LA DERECHA

UNILATERAL HACIA LA IZQUIERDA

BILATERAL

Plantear las Hipótesis:

Ho: μD≤0

Ha:μD >0Ho: μD≥0

Ha:μD < 0Ho: μD=0

Ha:μD≠0

nivel de Significancia α = 0.01 o 0.05. Asocia a tα=…Estadística de prueba T c=

DSD/√n

Decisión Re chazar H 0 Si t c>tn−1 , α Re chazar H 0 Si t c<−tn−1 , αRe chazar H0 Si |t c|≥t

n−1,α2

EJERCICIO DE APLICACIÓN

Supongamos que deseamos saber si la presión sistólica de personas alcohólicas se modifica cuando dejan el hábito de beber, para ello se toma una muestra de 10 personas que ingresan en el hospital Regional Virgen de Fátima para tratar su alcoholismo y se toma una medida de la presión sistólica antes y después de dos meses de haber dejado de beber. El experimento fue diseñado de esta manera ya que aunque se espera una reducción en la presión sanguínea, esta depende del valor inicial en cada individuo.

INDIVIDUO 1 2 3 4 5 6 7 8 9 10ANTES 140 165 160 160 175 190 170 175 155 160DEPUES 145 150 150 160 170 175 160 165 145 170REDUCCION -5 15 10 0 5 15 10 10 10 -10

A) Hipótesis de Prueba.H0: µD = 0H1: µD ≠ 0

B). Nivel de significación α = 5% de significancia 1-α = 95% de confianza.

C) Estadística De Contraste

CURSO: Métodos Estadísticos de Investigación ALUMNO: Ruiz Yoplac Lord Kelvin CICLO: VIIIT c=

DSD/√n

T c=6

8 . 433/√10

Page 13: Conceptos Basicos y Comparaciones de Medias en Poblaciones Normales

UNIVERSIDAD NACIONAL TORIBIO RODRIGUEZ DE MENDOZA – INGENIERIA AGROINDUSTRIAL

T=2.250

D) Región CríticaE) Decisión estadística: El valor del estadígrafo de contraste pertenece a la región de aceptación, por tanto aceptamos la hipótesis nula.F) Conclusión no estadística: Con los datos de los que disponemos no existe una evidencia significativa de que exista una diferencia entre la presión sistólica antes y después de haber dejado de beber.

6.2. Tamaño muestral grande (n ≥ 30)

Pasos UNILATERAL HACIA LA DERECHA

UNILATERAL HACIA LA IZQUIERDA

BILATERAL

Plantear las Hipótesis:

Ho: μD≤0

Ha:μD >0Ho: μD≥0

Ha:μD < 0Ho: μD=0

Ha:μD≠0

nivel de Significancia α = 0.01 o 0.05. Asocia a Zα=…Estadística de prueba Zc=

DS D/√n

Decisión Re chazar H 0 Si zc>z, α Re chazar H 0 Si zc<−z , αRe chazar H0 Si |zc|≥z

,α2

EJERCICIO DE APLICACIÓN

Elegimos al azar 30 matrimonios y observamos el número de veces que los hombres Han visitado alguna biblioteca en los tres últimos meses (X1) y el número de veces que Las mujeres han visitado alguna biblioteca en los tres últimos meses (X2). Los resultados se Muestran en la siguiente tabla.

CURSO: Métodos Estadísticos de Investigación ALUMNO: Ruiz Yoplac Lord Kelvin CICLO: VIII

Page 14: Conceptos Basicos y Comparaciones de Medias en Poblaciones Normales

UNIVERSIDAD NACIONAL TORIBIO RODRIGUEZ DE MENDOZA – INGENIERIA AGROINDUSTRIAL

¿Podemos afirmar que hay diferencia significativa entre los hombres y las mujeres de los matrimonios en cuanto al número de veces que van a la biblioteca?

A) Hipótesis de Prueba.

H0: µD = 0H1: µD ≠ 0

B). Nivel de significación

α = 5% de significancia 1-α = 95% de confianza.

C) Estadística de Contraste

D =1.7

SD =9.1547

Ahora Con Los Datos Obtenidos Encontramos ZC

Zc = 1.01711

D) Región Crítica

E) Decisión.

CURSO: Métodos Estadísticos de Investigación ALUMNO: Ruiz Yoplac Lord Kelvin CICLO: VIII

D=∑i=1

n

51

30D=

∑i=1

n

Di

n, SD

2 =∑i=1

n

(Di−D ) ²

n−1

SD2 =

∑i=1

n

(51−1 . 7 ) ²

30−1

Zc=D

S D/√nD→N ( μD ,

σ D2

n)Zc=

1 .79 .1547 /√30

Page 15: Conceptos Basicos y Comparaciones de Medias en Poblaciones Normales

UNIVERSIDAD NACIONAL TORIBIO RODRIGUEZ DE MENDOZA – INGENIERIA AGROINDUSTRIAL

En consecuencia, tenemos que aceptar H0

F) Conclusión.

Por tanto, no hay diferencia significativa entre los hombres y las mujeres de los matrimonios en cuanto al número de veces que van a la biblioteca. Por la tanto la respuesta es NO

APLICACIONES DE LA PRUEBA CHI – CUADRADO

Prueba de Ajuste a una distribución de Proporciones

El gerente de una empresa afirma que la probabilidad de producir un artefacto defectuoso es 0.25 y que, dado que la condición del artículo es independiente de la de los otros, el número de artículos defectuosos por caja debe ser una variable aleatoria con distribución binomial. El departamento de control de calidad selecciona al azar 200 cajas de cuatro artículos cada una de 4 artículos cada una obteniendo los siguientes resultados:

N° de artículos no defectuosos 0 1 2 3 4Frecuencias Observados 18% 19% 29% 23% 11%

26 32 60 62 20Después de esta prueba tomada se realizó los cambios necesarios para ver si la cantidad de artefactos defectuosos cambio.

1).- Hipótesis.

H0= las proporciones no cambiaron están iguales

π1 = π2, 18%, 19%, 29%, 23%, 11%

Ha= las proporciones cambiaron.

CURSO: Métodos Estadísticos de Investigación ALUMNO: Ruiz Yoplac Lord Kelvin CICLO: VIII

Page 16: Conceptos Basicos y Comparaciones de Medias en Poblaciones Normales

UNIVERSIDAD NACIONAL TORIBIO RODRIGUEZ DE MENDOZA – INGENIERIA AGROINDUSTRIAL

π1 ≠ π2

2).- α=5%

3).- Estadística de Prueba

XC2 =∑

i=1

k (o i−ei)2

e i

Calculando.Tipos Oi Pi Ei=NPi (Oi-Ei)2/Ei

1 26 0.18 36 2.7782 32 0.19 38 0.9473 60 0.29 58 0.0694 62 0.23 46 5.565

K=5 20 0.11 22 0.1818XC

2 =¿9.5408

4) Región Crítica

5) Decisión.XC2 Es mayor que X(k-1) se rechaza

H0 y se acepta Ha

6) Conclusión. Al 5% de significación las proporciones de los artefactos defectuosos han cambiado con las nuevas técnicas aplicadas para su mejora.

PRUEBA DE INDEPENDENCIA DE CRITERIO

A un grupo de 100 pacientes que se quejaba de no dormir bien se les administró dos tipos de tratamientos distintos (A,B). Al concluir el estudio se les preguntó si habían dormido bien o mal y se obtuvieron los siguientes resultados:

Entre los 60 pacientes a los que se les había administrado el tratamiento A, 40 habían dormido bien y 20 habían dormido mal. Entre los 40 pacientes a los que se les había administrado el tratamiento B, 15 habían dormido bien y 25 mal. Pues bien, pretendemos saber si el tipo de tratamiento influye en dormir bien o mal.

A) Hipótesis

H0: no existen diferencias significativas entre los dos tratamientos, o bien, que las dos variables estudiadas son independientesHa: existen diferencias significativas entre los dos tratamientos

TARTAMIENTO A TARTAMIENTO B totalDURMIERON BIEN 40 15 55

CURSO: Métodos Estadísticos de Investigación ALUMNO: Ruiz Yoplac Lord Kelvin CICLO: VIII

Page 17: Conceptos Basicos y Comparaciones de Medias en Poblaciones Normales

UNIVERSIDAD NACIONAL TORIBIO RODRIGUEZ DE MENDOZA – INGENIERIA AGROINDUSTRIAL

DURMIERON MAL 20 25 45total 60 40 100

B) significancia.

α= 5%

C) Estadística de prueba

D) XC2 =∑

i=1

n

∑j=1

n (Oij−eij)2

eij

Oij Eij (Oij - Eij)2/Eij

40 (60 x 55)/100 =33 1.4830 (60 x 45)/100 =27 0.3315 (40 x 55)/100 =22 2.22725 (40 x 45)/100 =18 2.722

XC2 =¿6.759

Calculando los grados de libertad (2-1) x (2-1) = 1

E) Región Critica

Decisión.XC2 Es mayor que Xα se rechaza

H0 y se acepta Ha

6) Conclusión. Al 5% de significación si existen diferencias significativas entre los dos tratamientos

PRUEBA DE BONDAD DE AJUSTE A LA DISTRIBUCION BINOMIAL

El número de alumnos por semana que sufren algún tipo de accidente en un colegio durante 36 semanas del periodo escolar es la siguiente:

CURSO: Métodos Estadísticos de Investigación ALUMNO: Ruiz Yoplac Lord Kelvin CICLO: VIII

Page 18: Conceptos Basicos y Comparaciones de Medias en Poblaciones Normales

UNIVERSIDAD NACIONAL TORIBIO RODRIGUEZ DE MENDOZA – INGENIERIA AGROINDUSTRIAL

N° alumnos accidentados (X) 0 1 2 3 4 o másN° alumnos con X accidentes (n1) 6 8 10 6 6

Probar si la muestra de datos se ajusta a una distribución de Poisson con intensidad l , conun nivel de significación de 5%.

a) Hipótesis H0: Los datos se ajustan a la distribución de Poisson Ha: Los datos no se ajustan a la distribución de Poisson.

b) α=5%

c) Estadística de Prueba.

Encontrando λ0∗6+1∗8+2∗10+3∗6+4∗6

36= 1.94

XC2 =∑

i=1

n

∑j=1

n (Oij−eij)2

eij

Donde ei=P (Ai )*36 y Ai=(X=i=1) para i= 1,2,3,4,5

Luego:

P (Ai ) =P(X=0)=(1. 94 )0 e−1. 94

0!=0 .1437 → e1=36∗0 .1437=5 . 1732

P (Ai) =P(X=1) =(1. 94 )1e−1 . 94

1!=0 .2788 → e2=36∗0 .2788=10 .0368

P (Ai) =P(X=2) =(1. 94 )2 e−1 . 94

2!=0 .2704 → e 3=36∗0 . 2704=9 .7344

P (Ai ) =P(X=3) =(1. 94 )3 e−1 . 94

3!=0 .1749→ e 4=36∗0 .1749=6.2964

P (Ai) =P(X≥4 ) =1−P( X<4)=0.1322→ei=36∗0 .1322=4.7592

CURSO: Métodos Estadísticos de Investigación ALUMNO: Ruiz Yoplac Lord Kelvin CICLO: VIII

Page 19: Conceptos Basicos y Comparaciones de Medias en Poblaciones Normales

UNIVERSIDAD NACIONAL TORIBIO RODRIGUEZ DE MENDOZA – INGENIERIA AGROINDUSTRIAL

Valores de X

n1 ei (ni - ei) 2 ei

0 6 5.1732 0.13211 8 10.0368 0.41332 10 9.7344 0.007253 6 6.2964 0.01395

4 o mas 6 4.7592 0.3235Total = 0.8901

Calculando los grados de libertad X2 (5 - 1 - 1) = (3,0.05)

d) Región Crítica

Decisión.XC2 Es menor que Xα no se

rechaza H0 y se rechaza Ha

Conclusión. Con 95% de confianza la muestra de datos correspondiente al número de accidentes escolares por semana se ajusta a la distribución de Poisson

CURSO: Métodos Estadísticos de Investigación ALUMNO: Ruiz Yoplac Lord Kelvin CICLO: VIII