Modulo Muestreo e Hipotesis

Embed Size (px)

Citation preview

2ndiceIntroduccin:................................................................................................................... 4Objetivos....................................................................................................................... 4General: .................................................................................................................... 4Especficos:............................................................................................................... 4Estrategias de Estudio............................................................................................... 6Metodologa a emplearse en el desarrollo del mdulo ................................................. 6Evaluacin y Acreditacin............................................................................................ 7UNIDAD 1: Revisin de Estadstica Descriptiva. ........................................................ 81.1 Variables ................................................................................................................. 8Una variable es una propiedad o caracterstica que puede variar y esta variacin es susceptible de medicin................................................................................................ 81.2Distribucin de frecuencias, medidas de centralizacin y dispersin para datos no agrupados:................................................................................................................ 91.2.1 Frecuencias de datos no agrupados: ................................................................ 91.2.2 Medidas de centralizacin ................................................................................. 91.2.3 Medidas de dispersin: .................................................................................. 111.3Distribucin de frecuencias, medidas de centralizacin y dispersin para datos agrupados:................................................................................................................... 121.3.1. Frecuencias de datos agrupados: ................................................................. 121.3.2 Medidas de centralizacin ............................................................................. 131.3.2 Medidas de dispersin ..................................................................................... 161.4 Medidas de Posicin ............................................................................................ 171.5 Grficos: Diagramas de barras, grfico de lneas, circular o de pastel,histogramas y polgonos de frecuencias ..................................................................... 20Cuadro Resumen 1: .................................................................................................... 21Cuadro Resumen 2: PRINCIPALES MEDIDAS DE DISPERSIN PARA DATOS AGRUPADOS Y NO AGRUPADOS........................................................................ 22Actividad 1: ................................................................................................................... 23Auto evaluacin 1.......................................................................................................... 23UNIDAD 2: TEORA DEL MUESTREO .................................................................. 242.1 Generalidades de la estadstica inferencial .......................................................... 242.2 Variables normalizadas y no normalizadas ........................................................ 242.2.1 Variable normalizada................................................................................... 242.2.2 Escalas ........................................................................................................... 242.3 La curva normal .................................................................................................... 252.3.1 Frmula y propiedades de la curva normal .................................................. 252.3.2 reas bajo la curva normal .......................................................................... 262.3.3 Lectura de la tabla........................................................................................ 272.3.3.1 Dado el valor de z hallar el rea ............................................................... 272.3.3.2 Dado el rea hallar el valor de z ............................................................... 282.4 Muestreo ............................................................................................................. 292.4.1 Poblaciones y muestras................................................................................ 302.4.1.1 Tipos de muestras ........................................................................................... 302.4.1.2 Frmulas para calcular el tamao de la muestra........................................ 31Actividad 2..................................................................................................................... 33Auto evaluacin 2.......................................................................................................... 34UNIDAD 3: PLANTEAMIENTO ............................................................................... 35DE HIPOTESIS ............................................................................................................ 353.1 Planteamiento de hiptesis, variables .................................................................. 353.1.1 Variables ...................................................................................................... 363.2 Tipos de hiptesis ................................................................................................ 363.2.1 Hiptesis de investigacin ( H i ). .................................................................. 363.2.2 Hiptesis nulas y alternativas ....................................................................... 373.2.3 Hiptesis estadsticas ................................................................................... 38Actividad 3..................................................................................................................... 40Auto evaluacin 3: ........................................................................................................ 40UNIDAD 4: PRUEBA DE HIPTESIS ..................................................................... 414.1 Errores de tipo I y de tipo II ............................................................................... 414.2 Nivel de significacin y nivel de confianza........................................................ 424.3 Pasos para la prueba de hiptesis y Tcnicas Estadsticas ................................. 424.3.1 z normalizado .............................................................................................. 424.3.2 t-student ....................................................................................................... 484.3.3 Prueba de diferencia de proporciones.......................................................... 514.3.4 Chi cuadrado ( c 2 ) ................................................................................... 534.3.5 La correlacin ............................................................................................... 56Actividad 4..................................................................................................................... 61Auto evaluacin 4: ........................................................................................................ 62Bibliografa ................................................................................................................. 63Anexo 1 .......................................................................................................................... 64Anexo 2 .......................................................................................................................... 65Anexo 3 .......................................................................................................................... 66Anexo 4 68Introduccin:La Estadstica ocupa un lugar importante dentro de la vida cotidiana en diversas reas. La educacin y la investigacin son sl dos de los muchos ejemplos que podramos citar. En este contexto, se hace imprescindible el conocimiento tanto de la Estadstica Descriptiva como Inferencial. Adems, con el avance de la tecnologa se han desarrollado herramientas de software que nos facilitan el trabajo y nos ahorran tiempo.Por tal motivo, se ha preparado este mdulo tratando de resumir los aspectos ms importantes, los que sern de mucha utilidad al momento de presentar resultados o probar una hiptesis en una investigacin, as como la utilizacin de la hoja electrnica Excel y el paquete estadstico GSTAT para que nos ayuden en el tratamiento y presentacin de la informacin.Esperamos que el mdulo, le sea de mucha ayuda y auguramos xito en el desarrollo de este y los posteriores eventos.ObjetivosGeneral:Proporcionar los elementos tericos y de software para el manejo de la Estadstica Descriptiva e Inferencial necesarios para la organizacin, presentacin y anlisis de datos, as como el tratamiento de hiptesis estadsticas.Especficos:v Recordarlos elementos bsicos de la Estadstica Descriptiva as como estrategias para su aprendizaje.v Conocer los elementos ms importantes de la teora de muestreo y su aplicacin en investigaciones reales.v Proporcionar las herramientas estadsticas indispensables para la prueba de hiptesis de manera que puedan ser aplicados posteriormente en sus trabajos de graduacin..v Conocer las principales herramientas que proporcionan la hoja electrnica Excel y el paquete GSTAT en cuanto a la estadstica descriptiva e inferencial.Estrategias de Estudio& Lea detenidamente los contenidos de cada tema.& Para la unidad I, compare los resultados obtenidos en el mdulo, con los que usted va a obtener en la clase prctica utilizando el computador.& Revise con cuidado los ejercicios resueltos, fijndose en cada paso realizado, luego reptalos recordando los pasos establecidos.& Resuelva los ejercicios propuestos tomando como base la teora y los ejercicios resueltos.UNIDAD 2: TEORA DEL MUESTREO2.1 Generalidades de la estadstica inferencialEl propsito de una investigacin no slo es describir las distribuciones de las variables, sino tambin el de inferir los resultados obtenidos en la muestra a la poblacin.La ESTADSTICA DESCRIPTIVA es la encargada de estudiar los ESTADGRAFOSque son resultados estadsticos obtenidos en una muestra.La ESTADSTICA INFERENCIAL es la encargada de estudiar los PARMETROS que son las estadsticas de la poblacin o universo, stos generalmente no se calculan pero son inferidos de los estadgrafos (con un grado de error o nivel de significacin).2.2Variables normalizadas y no normalizadasUna distribucin de datos puede tener medias y desviaciones estndar diferentes, este problema se puede solucionar transformando los datos medias y desviaciones idnticas; es decir, transformando los valores brutos en valores estandarizados. Las distribuciones de calificaciones estndar tienen valores fijos paras las medias (m) y las desviaciones estndar (s); as:La distribucin de calificaciones z tienen valores fijos m = 0 y s = 1.La distribucin de calificaciones de CI (coeficiente intelectual) de Wechsler tiene como valores m = 100 y s = 15.2.2.1Variable normalizadaSea x una puntuacin no elaborada (valor a transformarse) , X la media aritmtica muestral, s la desviacin estndar. Se llama puntuacin z o puntuacin normalizada z al siguiente cociente:z = x - Xsel valor de z indica la direccin y grado en que x se aleja de la media en unidades dedesviacin estndar. En esta escala m = 0 y s = 12.2.2 EscalasEn estadstica, como vimos antes se puede hablar de muchas escalas, pero en la prctica se utilizan especialmente dos: la no normalizada y la normalizada.2.2.2.1 Escala no normalizada o no elaborada (natural)Es un puntaje o una nota que se obtiene en la realidad, por ejemplo en una prueba. La representacin de estos puntajes se lo hace sobre una recta real donde tenemos la media aritmtica y los puntajes no normalizados.2.2.2.2 Escala normalizada o escala zSon puntuaciones z distribuidas en unidades de desviacin estndar (s = 1) positivamente y negativamente a partir de la media aritmtica que en este caso tiene el valor de cero. . .valores de z-4-3-2-1m=012341.96Ejemplo 11) Representar en la recta real los siguientes puntajes: 5,7,8,6,10, X = 7.2X . . . . . . . 567 7.289102) Un estudiante de cuarto ao de Ciencias Exactas de la ESPOCH tiene en lgebra 16 donde la X = 15 y s = 2; y tiene en Fsica 15 donde X = 14 y s = 2,2. Decir en cual de las dos asignaturas est mejor ubicado.Como dicha puntuacin est expresado en dos escalas diferentes, estadarizamos las escalas a puntuaciones z, as:Tipificamos 16: z = 16 - 15 = 0.5 , significa que el valor 16 est en la escala2normalizada z a 0.5 unidades de la media que es cero.Tipificamos 15: z = 15 - 14 = 0.45 , significa que el valor 15 est en la escala2.2normalizada z a 0.45 unidades de la media que es cero.En consecuencia, el mencionado estudiante est mejor ubicado en lgebra.2.3 La curva normal2.3.1 Frmula y propiedades de la curva normalLa curva normal o de Gauss es simtrica al eje y, su frmula es:11- z 2 x - Y =e 2 2 , donde z =11 - z2si Y = e 2donde s =1 es la forma tipificada, z se distribuye normalmente con2media cero y varianza 1.Algunas propiedades de la curva normal son:La curva es simtrica al eje vertical. La media, la mediana y el modo coinciden con el centro y valen cero, y cada unidad es una desviacin estndar.La grfica de la curva normal tiene la forma de una campana y su rea total bajo la curva es 1. Veamos algunos valores de z con su porcentaje correspondiente de rea:valor de z enrea bajo la curva(-1,1)68.27% (-2,2)95.45% (-3,3)99.73%El vrtice de la curva tiene coordenadas (z = 0, y = 0.4)La curva normal o distribucin muestral es terica; aunque en la prctica las distribuciones de muchas variables de las ciencias sociales se aproximan a una distribucin normal. Esta distribucin es la ms importante en estadstica.NOTA. El teorema del LIMITE CENTRAL manifiesta que aunque la distribucin de la poblacin de origen no sea normal la distribucin muestral de medias se aproxima a la normalidad conforme n se incrementa.2.3.2reas bajo la curva normalDado un valor de z se puede hablar de:1. rea en (-z, +z) (zona de aceptacin de la hiptesis nula en un ensayo a dos colas)2. rea fuera de (-z, +z) (zona de rechazo de la hiptesis nula en un ensayo a dos colas)3. rea hasta z(zona de rechazo de la hiptesis nula en un ensayo a una cola(cola izquierda))4. rea hasta z (zona de aceptacin de la hiptesis nula en un ensayo a una cola(cola derecha))5. rea despus de z (zona de rechazo de la hiptesis nula en un ensayo a una cola(cola derecha))2.3.3Lectura de la tabla2.3.3.1Dado el valor de z hallar el reaSe hace el proceso inverso, por ejemplo, si z = 1.65, a la izquierda de la tabla (ver anexo1) se ve el 1,6 y arriba el 5 el valor del cruce en la tabla es 0.45, que es el rea del centro al valor de z, luego:En un ensayo a dos colas a = 0.10 (10%), esto es, el rea entre los valores crticos negativo y positivo de z = 1.6 y z =1.6 es 0.90En un ensayo a una cola a = 0.05 (5%), esto es, el rea anterior al valor crtico de z = 1.6 es 0.95 y el rea posterior es 0.05NOTA. En el caso anterior de un ensayo a una cola el rea acumulada es de 0.95, esto significa que al valor crtico de z = 1.6 le corresponde el percentil 95. Esto es, el rea acumulada es correspondiente a un percentil de la distribucin.Ejemplo 21. En un curso de 17 estudiantes se tiene: X = 15 y s = 2.a) Qu porcentaje y cuntos estudiantes obtienen ms de 16?. b) Qu porcentaje y cuntos estudiantes estn bajo 13?.c) Encontrar el nmero de estudiantes que tiene de 12 a 17a) Tipificamos el 16: z = 16 - 15 = 0.52 RespuestaEn la tabla del anexo 1 vemos a la izquierda 0.5 y arriba 0, el valor que se obtiene es0.1915. Significa que desde el centro hasta el valor tipificado de z = 0.5 hay un rea de0.1915, luego, restamos de 0.5 y se obtiene: 0.5 0.1915 = 0.3085, que es el rea que falta en la cola derecha. Lo que significa que el 30.8% de estudiantes est sobre la nota de 16; es decir:100%1730.8%xluego, x = 30.8(17) = 5.2 , es decir, 5 estudiantes estn sobre 16.100b) Tipificamos el 13: z = 13 - 15 = -12En la tabla del anexo 1 vemos a la izquierda 1.0 y arriba 0, el valor que se obtiene es0.3413. Significa que desde el centro hasta el valor tipificado de z =-1 hay un rea de0.3413, luego, restamos de 0.5 y se obtiene: 0.5 0.3413 = 0.1587. Lo que significa que el 15.8% de estudiantes est bajo la nota de 13; es decir:100%1715.8%xluego, x = 15.8(17) = 2.68 , es decir, 2 a 3 estudiantes estn bajo 13.100c) Tipificamos el 17: z = 17 - 15 = 12En la tabla del anexo 1 vemos a la izquierda 1 y arriba 0, el valor que se obtiene es0.3413. Significa que desde el centro hasta el valor tipificado de z = 1 hay un rea de0. 3413Tipificamos el 12: z = 12 - 15 = -1.52En la tabla del anexo 1 vemos a la izquierda 1.5 y arriba 0, el valor que se obtiene es0.4332. Significa que desde el centro hasta el valor tipificado de z = -1.5 hay un rea de0.4332 a la izquierda del centro.Sumando las dos reas se tiene : 0.3413+0.4332 = 0.7745. Luego, el 77.45% de datos estn entre 12 y 17. Hallamos cuantos son:100%1777.45%xluego,12 a 17. x = 77.45(17) = 13 , es decir, 13 estudiantes tienen puntajes de1002.3.3.2Dado el rea hallar el valor de zEl valor del rea en realidad es el nivel de significacin a o del nivel de confianza 1-a.Ejemplo 31) Si se da el rea entre los valores negativo y positivo de z, se trata del nivel de confianza en un ensayo a dos colas. As, si 1-a = 0.95, se toma la mitad, esto es 0.475, se localiza este valor en el interior de la tabla del Anexo 1 y vemos que a la izquierda est 1.9 y arriba 6, luego z = 1.962) Si se da el rea fuera de los valores negativo y positivo de z, se trata del nivel de significacin (a) en un ensayo a dos colas. As, si a = 0.10 entonces 1- a = 1-0.10 =0.90, se toma la mitad que es 0.45. Este valor tiene a la izquierda 1.6 y arriba 5, luego,z = 1.653) Si se da el rea anterior al valor positivo de z , se trata del nivel de confianza 1- a en un ensayo a una cola. As, si 1- a = 0.95, se resta 0.5, esto es 0.45, se localiza este valor en el interior de la tabla y vemos que a la izquierda est 1.6 y arriba 5, luego, z = 1.654) Si se da el rea que sigue al valor positivo de z , se trata del nivel de significacin (a) en un ensayo a una cola. As, si a = 0.05, el rea desde el centro hasta el valor positivo de z es 0.45, se localiza este valor en el interior de la tabla y vemos que a la izquierda est 1.6 y arriba 5, luego, z = 1.65Ilustremos en grficos lo que acabamos de verSe da el rea entrelos valores negativo y positivo de z (1-a)Se da el rea fuerade los valores negativo y positivo de z (a)Se da el reaanterior al valor positivo de z (1- a)Se da el reasiguiente al valor positivo de z (a)2.4MuestreoSi se pudiera trabajar con todos los elementos de una poblacin, no cabra la estadstica inferencial, porque directamente se calcularan los parmetros de dicha poblacin. Pero muy a menudo se trabaja solamente con muestras de dicha poblacin, muestras que deben ser elegidas de modo probabilstico (principio de aleatoriedad), de tal manera que todos los elementos de la poblacin tengan la misma posibilidad de ser elegidos. Pero dicha seleccin casi nunca se realiza de manera totalmente aleatoria, sino que se utiliza tambin modos no probabilsticos (no aleatorios), buscando al menos el principio de representatividad de la muestra.NOTA. Hay que tener cuidado con los trminos aleatoriedad y representatividad, tenga presente lo siguiente:a) Es preferible una muestra representativa pequea a una muestra grande no representativa.b) A veces se cree que se est tomando una muestra aleatoria cuando en realidad no lo es; as, si se quisiera consultar la opinin a los ciudadanos de Chimborazo sobre sus preferencias para elegir prefecto y se encuesta a las 10 de la maana a una muestra al azar por telfono, esta muestra no es representativa porque contestaran nicamente las personas que estn a esa hora en la casa y no opinaran estudiantes, docentes y otros profesionales que no tienen telfono en ese momento ni personas del permetro rural sin telfono. Estos resultados no sern confiables y sern sesgados.2.4.1Poblaciones y muestrasEl problema y los objetivos de la investigacin orientan a ver cules son las unidades de anlisis (libros, personas, instituciones, organizaciones; etc), luego se procedea delimitar la poblacin. Cuando sta es muy grande (para nuestro estudio) se selecciona una parte de ella denominada muestra.Elegir una muestra probabilstica o no probabilstica depende del tipo de estudio, del nivel de inferencia que se quiera dar a los resultados; as como de la disponibilidad de tiempo y recursos del investigador.2.4.1.1 Tipos de muestrasProbabilstica Todos los elementos de la poblacin tienen la misma probabilidad de ser elegidosNo probabilstica No todos los elementos de la poblacin tienen la misma probabilidad de ser elegidos. Aleatoria Simple: En la que sus elementos han sido selelccionados por procesos aleatoriosEstratificada: Consiste en considerar categoras tpicas diferentes entre s (estratos) que poseen gran homogeneidad respecto a alguna caracterstica.Por conglomerados: La unidad muestral es un grupo de elementos de la poblacin que forman una unidad, a laque llamamos conglomerado. El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto nmero de conglomerados (el necesario para alcanzar el tamao muestral establecido) y en investigar despus todos los elementospertenecientesalosconglomerados elegidos.Casual : Se seleccionan a los n primeros elementos necesarios para la muestra, que sean de fcil acceso. (Voluntarios)Intencional :Secaracterizaporunesfuerzo deliberado de obtener muestras "representativas" incluyendoagrupossupuestamentetpicos. (Expertos)Por Bola de nieve: Se localiza a algunos de los elementos muestrales los que conducen a otros y stos a otros hasta completar la muestra.Por cuotas: En este tipo de muestreo se fijan unas "cuotas" que consisten en un nmero de individuos que renen unas determinadas condiciones y se eligen los primeros que se encuentren.Cmo se seleccionan los elementos muestrales para una muestra probabilstica?Las dos formas probabilsticas principales son:a) Procesos Aleatorios simples (Tmbola).- Se numeran los elementos muestrales del 1 al N, se hacen fichas una por cada elemento, se las revuelve en una caja y se sacan n fichas, estos elementos conformarn la muestra.b) Seleccin sistemtica de elementos muestrales.- Es muy til y fcil, se selecciona dentro de una poblacin N una muestra de n elementos a partir de un intervalo K, siendoK = N .nEjemplo 4. Supongamos que la poblacin est formada por 90 colegios y se tiene queelegir una muestra de 15 colegios. Se numeran los colegios del 1 al 90, como K = N =n90 = 6, entonces, se eligen los colegios numerados, por ejemplo, con 1,7,13, ...hasta15completar los 15.c) Tabla de nmeros Aleatorios: Es una tabla generada aleatoriamente (generalmente por una computadora). La forma de utilizar la tabla es la siguiente: Si el total de la poblacin es un nmero de 3 cifras, por ejemplo 160, se debe escoger un punto desde el cual empezar a obtener los nmeros, que puede ser por filas, columnas diagonal, luego hacia arriba, abajo, derecha o izquierda. En nuestro ejemplo, se van formando nmeros de 3 cifras y se seleccionan los elementos hasta completar el nmero deseado.(Ver Anexo 4)2.4.1.2 Frmulas para calcular el tamao de la muestraCuanto mayor sea la muestra mejor representar a la poblacin. Las muestras, generalmente se dicen pequeas si tiene menos de 30 elementos, se dicen grandes si tienen ms de 30 elementos.A partir de los estadgrafos (o estadsticos) se pueden calcular los parmetros correspondientes con un cierto margen de error.Los estadsticos calculados sobre todas las muestras que es posible extraer de una poblacin se distribuyen segn una curva normal o distribucin muestral.Veamos entonces como elegir el tamao de la muestra en poblaciones finitas e infinitas:En poblaciones finitas (menos de 5.000, posiblemente con un nmero elevado de preguntas, muchas preguntas abiertas, muestra de varios grupos)a)n = Np q2donde (N - 1) ME NC2 + pq n = tamao de la muestraN = tamao del universo (o de la poblacin)p = probabilidad de ocurrencia (homogeneidad del fenmeno, generalmente p = 0,5)q = 1-p = probabilidad de no ocurrenciaME = margen de error o precisin admisible con que se toma la muestra (generalmente se elige del 0,01 al 0,15)NC = nivel de confianza o exactitud con que se infieren los resultados (valor terico del normalizado z en un ensayo a dos colas) ; por ejemplo:Si ME = 0. 3174; o sea al 68.26% de confianza, NC = 1Si ME = 0.15; o sea al 85% de confianza, NC = 1.44Si ME = 0.1336; o sea al 86.64% de confianza, NC = 1.50Si ME = 0.10; o sea al 90% de confianza, NC = 1.64Si ME = 0.05; o sea al 95% de confianza, NC = 1.96 (el ms usual) Si ME = 0.03; o sea al 97% de confianza, NC = 2.17Si ME = 0.01; o sea al 99% de confianza, NC = 2.57Si ME = 0.0026; o sea al 99.7% de confianza, NC = 3NOTA.- Para que el nivel de confianza sea NC=2 (constante) como dicen algunos libros, el margen de error debe ser ME= 0.055b) n = NME2 (N - 1) + 1donden = tamao de la muestraN = tamao de la poblacinME = margen de error o precisin admisibleNOTA. Cundo se puede obtener la frmula b de la frmula a?En poblaciones denominadas infinitas (ms de 5.000; cuestionarios entre 20 y 40 preguntas de preferencia cerradas de respuestas mutuamente excluyentes, por ejemplo: si, no; muy bueno, bueno, regular, malo; etc), se puede utilizar la siguiente frmula:2c) n = NC pq donde: ME 2n = Tamao de la muestrap = Probabilidad de ocurrencia (homogeneidad del fenmeno, generalmente p = 0.5)q = 1-p = Probabilidad de no ocurrenciaME = margen de error o precisin admisibleNC = nivel de confianza o exactitud (expresado como el valor terico (en un ensayo a dos colas ) del normalizado z que determina el rea de probabilidad buscada); es decir , idntico al literal a).NOTA. Cuando la poblacin es igualmente grande y no se conoce exactamente N, algunos investigadores utilizan la c) de la siguiente manera:Z 2s 2d) n =(similar a la c))E 2Donde:Z es el nivel de confianza con que se generaliza a la poblacin (NC) E es el margen de error o precisin con que se toma la muestra (ME)s 2 es la varianza poblacional que se expresa en trminos de la probabilidad de lavariabilidad del fenmeno (mxima variabilidad = 0.5)Actividad 2EJERCICIO 11)Un estudiante de cuarto semestre de Ciencias Exactas de la UNACH tiene en lgebra 8 donde la X = 7.5 y s = 1.2; y tiene en Fsica 9 donde X = 7 y s = 1.1. En cual de las dos asignaturas est mejor ubicado?.2) Suponiendo que unas puntuaciones se distribuyen normalmente y que m = 60 ys = 8. En esta distribucin un estudiante tiene una nota de 65. Transforme a escala z.EJERCICIO 2. Suponiendo que se trata de un ensayo a dos colas1) Si a = 0.08 (92% de confianza), hallar z.2) Si a = 0.12 (12% de significacin), hallar z.EJERCICIO 3: En un curso de 15 estudiantes se tiene: X = 7.8 y s = 1.2. a) Qu porcentaje y cuntos estudiantes obtienen ms de 7?.b) Qu porcentaje y cuntos estudiantes estn bajo 6?. c) Encontrar el nmero de estudiantes que tiene de 6 a 8.d) Encontrar el porcentaje y el nmero de estudiantes que tienen de 8 a 10.e) Realizar todos los literales anteriores utilizando Excel y compare los resultados.EJERCICIO 4: En un centro escolar de 1.200 estudiantes, hay 100 estudiantes en la seccin PRE bsica, 800 en la seccin bsica, 300 en la seccin Bachillerato. Se desea estudiar el nmero de estudiantes que aprueban todas las asignaturas, se sabe que puede haber diferencias entre los distintos niveles educativos, por lo que es de inters para el estudio que en la muestra estn representadas todas las secciones.a) Qu tamao de muestra sugiere con un error del 5%?b) Cuntos estudiantes de cada seccin se deben incluir para que la muestra sea significativa?c) Si se desea una muestra ms pequea que la obtenida en el literal a) Qu margen de error considera se debera usar?Auto evaluacin 2Diga si son verdaderos o falsos los siguientes enunciados:a) La curva normal es simtrica respecto al eje y.b) La media en la curva normal es 1 y la desviacin estndar es 0.c) Bajo la curva normal el 68.27% de los datos se encuentra a una desviacin estndar de la media.d) Una muestra es no probabilstica cuando todos los elementos de la poblacin tienen la misma probabilidad de ser elegidos.UNIDAD 3: PLANTEAMIENTO DE HIPOTESIS3.1 Planteamiento de hiptesis, variablesLa hiptesis es una posible respuesta al problema planteado, es una suposicin anticipada que deber ser confirmada o refutada. Responde a la pregunta Qu quiero probar?Una hiptesis puede originarse en la identificacin con teoras (en el marco terico), en el resultado de otros estudios, en la intuicin lgica y racional del investigador de la observacin de los hechos; o, de la informacin emprica.En una investigacin se podra tener una, dos o ms hiptesis o ninguna. Las hiptesis indican lo que estamos buscando o tratando de probar.Las hiptesis deben relacionar (generalmente dos) variables.Ejemplo 1: A mayor ingreso econmico mejor nivel de vida de la familia.Una hiptesis para considerarla bien formulada y poderla verificar empricamente debe reunir las siguientes caractersticas (requisitos o condiciones) principales:1) Estar lgicamente formulada o estructurada mediante las unidades de observacin, las variables y los trminos de enlace, refirindose a situaciones concretas o reales de manera sencilla, precisa y clara.2) Para que sea cientfica debe tener referentes tericos; y, la relacin entre las variables debe ser observable y medible en la realidad, verificable o refutable con referentes empricos de un universo determinado.3) En el momento de su planteamiento se debe pensar en la tcnica para su prueba, de acuerdo al tipo de variables.NOTA. En una tesis se puede tener una sola hiptesis de investigacin o de trabajo si en ella se globaliza lo que pretendemos probar. En ciertos estudios complejos es posible que sea necesario plantear una hiptesis principal o general de acuerdo al objetivo general, y otras hiptesis secundarias o particulares de acuerdo a ciertos objetivos particulares.NOTA. Recuerde que debe haber una intima relacin entre el problema general, el objetivo general y la hiptesis general; entre los problemas particulares o secundarios, los objetivos particulares o especficos y las hiptesis particulares.3.1.1VariablesQu es una variable?. Es una propiedad o cualidad (de la realidad) que puede variar y esta variacin es susceptible de medicin por medio de indicadores.NOTA. Pueden haber hiptesis que tericamente sean muy valiosas pero que no se puede probar en la realidad. Ej. El alma de un nio es ms blanca que la de un adulto3.2 Tipos de hiptesis3.2.1 Hiptesis de investigacin ( H i ).Son las que se utilizan durante el desarrollo del trabajo, se formulan en forma afirmativa. Ej. Los estudiantes de la muestra A difieren en rendimiento de los estudiantes de la muestra B utilizando metodologas diferentes.Estas a su vez pueden ser:a) Hiptesis Descriptivas.- Son simples afirmaciones de ciertos hechos o fenmenos sujetos a comprobacin. Se pueden plantear en estudios descriptivos. Pueden involucrar una sola variable.- Sealan la presencia de cierto fenmeno en una poblacin.Ej.1. El porcentaje de votantes por el candidato N.N ser superior al 70%. Pueden relacionar dos o ms variables mediante asociacin, pero dicha relacin no es causal.Ej1. A mayor ingreso econmico familiar mayor escolaridad de los hijos.NOTA.- Estas hiptesis se pueden probar utilizando por ejemplo porcentajes, tasas, incremento porcentual.b) Hiptesis Correlacionales.- Especifican la relacin entre dos (correlacin bivariada) o ms variables (correlacin multivariada); o sea, establecen que dos o ms variables estn asociadas y a veces indican cmo estn asociadas.Ej.1.Los profesores dematemtica muestran cadavez mayores niveles de conocimientos (claramente se ve la correlacin bivariada entre tiempo y conocimientos) Ej.2. A mayor nivel de ingreso en una familia mayor nivel de escolaridad de los hijos Ej.3. Hay relacin entre el perfil profesional y la calidad de la prctica profesionalNOTA.- Si una hiptesis es puramente correlacional, no tiene sentido hablar de variable independiente y variable dependiente.Ej. Los alumnos que tienen altas calificaciones en matemtica tienden a tener altas calificaciones en estadstica.Para hablar de variable independiente y variable dependiente es necesario que la hiptesis sea causal.NOTA.- Una hiptesis correlacional se puede probar con Chi cuadrado y se puede medir la magnitud de la correlacin entre las dos variables con el coeficiente de correlacin de Pearson o de Spearman.c) Hiptesis de la diferencia entre grupos.- Se utilizan cuando se comparan grupos, en estudios experimentales y cuasiexperimentales.Ej.1. Hay diferencia de percepcin entre los que miran en blanco y negro y los que miran a colores un determinado comercial.Ej.2. El rendimiento de los alumnos del grupo A es superior al rendimiento de los alumnos del grupo B utilizando metodologas diferentes.NOTA.- Una hiptesis de la diferencia entre grupos se puede probar con: z-normalizado o t-student o diferencia de proporcionesd) Hiptesis que establecen relacin de causalidad .- Estas hiptesis establecen relaciones de causa-efecto entre las variables, pueden ser enunciados condicionales.Ej.1. El divorcio de los padres provoca bajo rendimiento de los hijos.Ej.2. Si la metodologa utilizada en el proceso de enseanza es adecuado, entonces el rendimiento escolar es bueno.NOTA. Cuando la relacin de causalidad en una hiptesis se expresa entre varias variables dependientes e independientes que se relacionan entre s de distintas maneras, es preferible separar en dos o ms hiptesis.3.2.2 Hiptesis nulas y alternativasa) Hiptesis nula ( H o ).- Generalmente se la plantea con la intencin de rechazarla y aceptar la de investigacin, pero no siempre es as.Ejemplo 2: No hay diferencia en el rendimiento de los estudiantes de la muestra A y los estudiantes de la muestra B; o tambin El rendimiento de los estudiantes de la muestra A es igual al rendimiento de los estudiantes de la muestra B .b) Hiptesis alternativas ( H a ).- Indican posibilidades alternas ante las hiptesis de investigacin y nula. A veces constituyen otras hiptesis de investigacin adicionales a las originales.Ejemplo 3: De hiptesis de investigacin, nula y dos alternativas:H i : El rendimiento de los estudiantes ES DIFERENTE utilizando las metodologas A yB.H o : El rendimiento de los estudiantes ES IGUAL utilizando las metodologa A y BH a : El rendimiento de los estudiantes que utilizaron la metodologa A ES SUPERIORal de los que utilizaron la metodologa B.H a : El rendimiento de los estudiantes que utilizaron la metodologa A ES INFERIORal de los que utilizaron la metodologa B.3.2.3Hiptesis estadsticasSon la transformacin de las hiptesis de investigacin, nulas y alternativas en smbolos matemticos o estadsticos. Se formulan con la finalidad de probarlas o rechazarlas cuando los datos que se van a recoger son cuantitativos: nmeros, porcentajes, proporciones, promedios.Las hiptesis estadsticas pueden ser:a) Hiptesis estadsticas de estimacin (o de diferencia entre el valor hipotetizado y el valor observado en la muestra).- Son las correspondientes a las hiptesis de investigacin descriptivas de una variable. Se utiliza cuando se desea evaluar un supuesto respecto al valor de alguna caracterstica de una muestra de individuos u objetos y de una poblacin.Ejemplo 4: El promedio mensual del sueldo de los profesores de la UNACH esdiferente a 150 dlares.Al transformar esta hiptesis de investigacin a hiptesis estadstica, vemos que el parmetro al que hace referencia es la media (m). Luego, su simbologa estadstica es:H i : m 150Este es un ensayo a dos colas porque al ser m 150 puede ser : m > 150 (cola derecha) om< 150 (cola izquierda). Ms adelante hablaremos de estoNOTA. Estas hiptesis se pueden probar con z-normalizado o t-student.b) Hiptesis estadsticas de la diferencia de medias (u otros valores).- Comparan una estadstica entre dos grupos (o en un mismo grupo donde se han utilizado por ejemplo dos metodologas).Ejemplo 5H i : El promedio (m1) de rendimiento del grupo A utilizando la metodologa M difiere del promedio (m2) de rendimiento utilizando la metodologa N.H i : m1 m2 (simbologa estadstica de esta hiptesis de investigacin (dos colas))H o : El promedio (m1) de rendimiento del grupo A utilizando la metodologa M no difiere del promedio (m2) de rendimiento utilizando la metodologa N.H o : m1= m2 (simbologa estadstica de la hiptesis nula)H a : El promedio (m1) de rendimiento del grupo A utilizando la metodologa M es superior al promedio (m2) de rendimiento utilizando la metodologa N.H a : m1 > m2 (simbologa estadstica de la primera hiptesis alternativa (cola derecha))H a : El promedio (m1) de rendimiento del grupo A utilizando la metodologa M es inferior al promedio (m2) de rendimiento utilizando la metodologa N.H a : m1< m2 (simbologa estadstica de la segunda hiptesis alternativa (cola izquierda))NOTA. Estas hiptesis se pueden probar con z-normalizado o t-student. Su estimacin puede hacerse con promedios, mediana, porcentajes.c) Hiptesis estadsticas de correlacin.- Tienen por objeto traducir en trminosestadsticos una correlacin entre dos ( smbolo r) o ms variables (smbolo R)Ej. existe una correlacin significativa entre el coeficiente intelectual (x) y el tiempo para aprender un concepto (y)H i : rxy 0H o : rxy = 0 (indica que las dos variables no estn correlacionadas)NOTA. No hay una regla para decidir cuantas hiptesis debe tener una investigacin; esto mas bien depende del tipo de estudio, deben ser las mnimas necesarias y suficientes para realizar el trabajo.NOTA IMPORTANTE 1. Cuando el investigador plantea hiptesis de investigacin y nula; e hiptesis estadstica de investigacin y nula, se puede hablar de:Modelo Lgico.- Es el enunciado de las hiptesis de investigacin y nulaModelo Matemtico.- Es la expresin matemtica de las hiptesis de investigacin y nula.Modelo Estadstico.- Son las frmulas estadsticas de la correspondiente tcnica a utilizarse, con el respectivo nivel de significacin y el significado de los smbolos.Ejemplo 6:MODELO LGICOH i : El promedio mA de rendimiento del grupo A difiere del promedio mB de rendimiento del grupo B.H o : El promedio mA de rendimiento del grupo Aes igual al promedio mB de rendimiento del grupo B.MODELO MATEMTICOH i : mA mB (simbologa matemtica de esta hiptesis de investigacin (dos colas))H o : mA= mB (simbologa matemtica de la hiptesis nula) MODELO ESTADISTICOSi los estadsticos de prueba son los promedios y las varianzas muestrales y conocien do los tamaos de las muestra A y B, la tcnica a utilizarse en la prueba de estas hiptesis es el t-student.t = X A - X BA(n A - 1)s 2 + (n B - 1)s 2 1 1 n A + n B - 2 n A + n B Bse puede utilizar un nivel de significacin a = 0.05NOTA. Ms adelante se indica la forma cmo se realiza la prueba de hiptesis.Actividad 31.- En cada uno de los siguientes casos identifique la clase de hiptesis y luego escriba las hiptesis nulas correspondientes:a) A mayor preparacin del docente mejor nivel acadmico en sus estudiantes b) El rendimiento de los estudiantes del grupo A es superior al rendimiento delos estudiantes del grupo B.c) La media de los alumnos del grupo 1 difiere de 17.2.- Escriba un ejemplo de hiptesis estadsticas de estimacin y un ejemplo de hiptesis estadsticas de diferencia de medias.Auto evaluacin 3:Complete la(s) palabra(s) necesaria(s) para obtener enunciados verdaderos:1.- Cuando se puede determinar una variable independiente y una variable dependiente se trata de una hiptesis . . . . . . . . . . . . . . . . . . . . . .2.- Las hiptesis estadsticas son la transformacin de las hiptesis de investigacin, nulas y alternativas en . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3.- Una hiptesis debe estar lgicamente formulada o estructurada mediante . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ., refirindose a situaciones . . . . . . .. . . . . . . . . . . . . . . . de manera sencilla, precisa y clara.UNIDAD 4: PRUEBA DE HIPTESISPrueba de hiptesis - Tcnicas estadsticasUna vez que se ha realizado el anlisis parcial y dinmico (de los datos descriptivos) de la(s) muestra(s), se hayan calculado los estadgrafosnecesarios, se procede a elegir el estadstico ms apropiado para la prueba de la(s)hiptesis.Las hiptesis planteadas deben ser sometidas a prueba para ver si son apoyadas o refutadas de acuerdo a los resultados de los datos obtenidos. Mientras ms investigaciones apoyen una hiptesis ms credibilidad y validez tendr en el contexto en el que se la plante.Una prueba de hiptesis estadstica es una regla que con base en una hiptesis nula ( H o) nos ayuda a decidir si sta se acepta o rechaza.Generalmente, en educacin, la prueba de hiptesis se realiza: a) Cuando se analiza alguna caracterstica (rendimiento por ejemplo) de dos muestras; b) Cuando se analiza el rendimiento de un grupo al que se le ha aplicado dos metodologas diferentes y se quiere establecer que una de ellas es mejor que la otra ( H a ); c)Cuando se quiere ver si el rendimiento entre dos grupos de alumnos de diferentes colegios es el mismo ( H o );d) Cuando se analiza por ejemplo caractersticas cuantitativas de un grupo y se compara con algn promedio poblacional hipotetizado m; etc.Se pone a su consideracin con ejemplos ilustrativos las siguientes tcnicas estadsticas para la prueba de hiptesis: z normalizado, t-student, prueba de diferencia de proporciones, Chi cuadrado ( c 2 ), los coeficientes de correlacin de Pearson, Spearman y Kendall para ver la correlacin o la concordancia entre variables.4.1Errores de tipo I y de tipo IICuando aceptamos o rechazamos una hiptesis podemos cometer errores, por ejemplo se podra rechazar una hiptesis cuando debera ser aceptada (cuando las muestras no son significativas o son mal tomadas), a este error se lo conoce como error de TIPO I, y si se acepta una hiptesis que se debera rechazar se comete un error de TIPO II. Por lo tanto, se trata de minimizar los errores de decisin, tarea que no resulta tan fcil; pues, al intentar reducir los errores de tipo I podramos incrementar los errores de tipo II y viceversa.Se logra una reduccin de los dos errores al mismo tiempo cuando se incrementa el tamao de la muestra, lo cual a veces es posible y a veces no; o al menos se seleccionan los elementos de la muestra de tal manera que sea una verdadera representacin de la poblacin.4.2Nivel de significacin y nivel de confianzaEl error de tipo I se denota por a y se lo llama nivel de significacin y generalmente se toma (fijo) los valores entre 0.01 (1%) y0.15 (15%) (el ms usual es 0.05 (5%)).Representa reas de riesgo (de rechazo de la hiptesis H o ) o confianza (de aceptacinde la hiptesis de investigacin H i ) en la distribucin normal (muestral) cuya rea totalbajo la curva se considera 1. Algunos autores aceptan de 0.01 (1%) a 0.10 (10%)Al valor 1- a se le llama nivel de confianza. Por ejemplo, cuando se elige a = 0.05 entonces el margen de error que cometemos es del 5%, es decir tenemos un 95% de confianza de que se est tomando la decisin adecuada; luego, el nivel de confianza es1- a = 0.95.NOTA.- Una decisin es adecuada cuando se rechaza la hiptesis nula cuando es falsa o se acepta cuando es verdadera.NOTA.- A mayor conocimiento del tema menor ser el valor de a4.3Pasos para la prueba de hiptesis y Tcnicas EstadsticasA continuacin se indican los pasos generales que se siguen para realizar la prueba de la(s) hiptesis:1) Planteamiento de las hiptesis.2) Determinacin del Nivel de significacin.3) Criterio con el que se rechaza o acepta H o .4) Clculos con las frmulas correspondientes a la tcnica estadstica seleccionada.5) Decisin que se toma de acuerdo a los valores calculados y tericos.A continuacin vamos a tratar las pruebas estadsticas:z normalizado, t-student, diferencia de proporciones, Chi cuadrado, y los coeficientes de correlacin de Pearson, Spearman y Kendall.De acuerdo al diseo de la investigacin, al tipo de los datos recogidos y la(s) hiptesis planteada(s) se deber seleccionar el estadstico ms apropiado para probar la(s) hiptesis.4.3.1z normalizadoSi el valor de la varianza poblacional s2 es conocido, entonces la estadstica de prueba es la media muestral x . La distribucin muestral es una distribucin normal de puntuaciones z en unidades de desviacin estndar.DEF. Se llama puntuacin z de la distribucin (normal) y se denota con z t osimplemente z al valor crtico que separa las reas de rechazo y aceptacin de la hiptesis nula (ver Anexo 1).En un ensayo a dos colas, se tiene:Para un nivel de significacin del 1% z t = 2.57El rea entre el centro y el valor terico se obtiene as: 0.5 (0.01)/2 = 0.495. Viendo0.495 en el interior de la tabla del Anexo 1, encontramos para 0.4949 que es el ms prximo a 0.495, a la izquierda 2.5 y arriba 7; luego, el valor terico es 2.57Para un nivel de significacin del 5% z t = 1.96El rea entre el centro y el valor terico se obtiene as: 0.5 (0.05)/2 = 0.475. Viendo0.475 en el interior de la tabla del Anexo 1, encontramos a la izquierda 1.9 y arriba 6;luego, el valor terico es 1.96Para un nivel de significacin del 10% z t = 1.64El rea entre el centro y el valor terico se obtiene as: 0.5 (0.10)/2 = 0.45. Viendo0.45 en el interior de la tabla del Anexo 1, encontramos para 0.4495 que es el ms prximo a 0.45, a la izquierda 1.6 y arriba 4; luego, el valor terico es 1.64En un ensayo a una cola, se tiene:Hiptesis unidireccional, cola derechaHiptesis unidireccional, cola izquierdaPara un nivel de significacin del 1% z t = 2.33El rea entre el centro y el valor terico se obtiene as: 0.5 (0.01) = 0.49. Viendo 0.49 en el interior de la tabla del Anexo 1, encontramos para 0.4901 que es el ms prximo a0.49, a la izquierda 2.3 y arriba 3; luego, el valor terico es 2.33Para un nivel de significacin del 5% z t = 1.64El rea entre el centro y el valor terico se obtiene as: 0.5 (0.05) = 0.45. Viendo 0.45 en el interior de la tabla del Anexo 1, encontramos para 0.4495 que es el ms prximo a0.45, a la izquierda 1.6 y arriba 4; luego, el valor terico es 1.64Para un nivel de significacin del 10% z t = 1.28El rea entre el centro y el valor terico se obtiene as: 0.5 0.10 = 0.4. Viendo 0.4 en el interior de la tabla del Anexo 1, encontramos para 0.3997 que es el ms prximo a0.4, a la izquierda 1.2 y arriba 8; luego, el valor terico es 1.28Llamaremos valor calculado de la puntuacin z al valor que se obtiene utilizando una de las frmulas para z; as por ejemplo:En el caso de una muestra A (con una distribucin muestral normal de la poblacin) :z = x - msndonde: x es la media aritmtica muestral, s es la desviacin tpica poblacional, m es la media poblacional o hipotetizada.Luego se ve si z calculado cae en la regin de rechazo o aceptacin de la hiptesis nula. EJEMPLOEn una prueba de rendimiento a 40 estudiantes de la FIE se obtiene como promedio x =7.6, la varianza poblacional es s = 1.1. Pruebe que este promedio 7.6 difiere significativamente del promedio poblacional m = 7 con un nivel de significacin del5%.1) Planteamiento de las hiptesisH i : m 7 (El promedio de rendimiento del grupo es diferente a 7)H o : m = 7 (El promedio de rendimiento del grupo es igual a 7)2) Nivel de significacina = 0.053) CriterioRechace la H o si z c -1.96 o z c 1.96Donde 1.96 es el valor terico de z en un ensayo a dos colas con un nivel designificacin de 0.05, y z cfrmula: es el valor calculado de z que se obtiene aplicando laz = x - n4) ClculosReemplazando los datos x = 7.6, s = 1.1, m = 7 y n = 22, en la frmula, se obtiene:z = x - = 7.6 - 7 = 0.6 = 3.441.1n40 0.17395) DecisinComo el valor de z calculado es mayor al valor de z terico; esto es:z c = 3.441.96 = z t3.44 est en la zona de rechazo de la hiptesis nula, luego queda aceptada la hiptesisde investigacin, esto es : El promedio de rendimiento del grupo es diferente a 7.En el caso de dos muestras A y B de medias x A y x B respectivamente, y conla hiptesis nula H o : mA =mBAsBSi se conocen los valores de las varianzas poblacionales,puntuacin z , cuyo valor se calcula con la siguiente frmula: s 2 ,2 se utiliza laz =x A - x BEJEMPLO 22ssA +Bn An BEn una prueba de rendimiento a los grupos A con n AESPOCH se han obtenido los siguientes resultados: = 20, y B con n B = 18 de lax A = 7.9x B = 7.1s A = 0.9s B = 1.3Pruebe que el rendimiento de los dos grupos es significativamente diferente con un nivel del 0.051) Planteamiento de las hiptesisH i : mA mB (El promedio de rendimiento del grupo A es diferente al promedio de rendimiento del grupo B)H o : mA = mB (El promedio de rendimiento del grupo A es igual al promedio de rendimiento del grupo B )2) Nivel de significacina = 0.053) CriterioRechace la H o si z c -1.96 o z c 1.96Donde 1.96 es el valor terico de z en un ensayo a dos colas con un nivel designificacin de 0.05, y z cfrmula: es el valor calculado de z que se obtiene aplicando laz = x A - x B4) ClculosReemplazando los datos c 2 2A + Bn A n Bx A = 7.9x B = 7.122s A = (0.9)2 2 = 0.81s B = (1.3) = 1.69n A = 20n B = 18en la frmula correspondiente, se obtiene:z c = x A - x B = 7.9 - 7.1 = 0.8 = 2.1822A +Bn An B 0.8120 + 1.6918 0.36665) DecisinComo el valor de z calculado es mayor al valor de z terico; esto es:z c = 2.18 1.96 = z t2.18 est en la zona de rechazo de la hiptesis nula, luego queda aceptada la hiptesis de investigacin, esto es : El promedio de rendimiento del grupo A es diferente al promedio de rendimiento del grupo B.NOTA.Si en el ejemplo anterior, se pidiera probar que el rendimiento del grupo A es significativamente superior al rendimiento del grupo B con un nivel de significacin del0.05, entonces se trata de un ensayo a una cola y la prueba de hiptesis se realizara de la siguiente manera.1) Planteamiento de las hiptesisH i : mA > mB (El promedio de rendimiento del grupo A es superior al promedio de rendimiento del grupo B)H o : mA = mB (El promedio de rendimiento del grupo A es igual al promedio de rendimiento del grupo B )2) Nivel de significacina = 0.053) CriterioRechace la H o si z c 1.64Donde 1.64 es el valor terico de z en un ensayo a una cola con un nivel designificacin de 0.05, y z cfrmula: es el valor calculado de z que se obtiene aplicando laz = x A - x B4) ClculosReemplazando los datos c 2 2A + Bn A n Bx A = 7.9x B = 7.122s A = (0.9)2 2 = 0.81s B = (1.3) = 1.69n A = 20n B = 18en la frmula correspondiente, se obtiene:z c = x A - x B = 7.9 - 7.1 = 0.8 = 2.185) Decisin 2 2A + Bn A n B 0.8120 + 1.6918 0.3666Como el valor de z calculado es mayor al valor de z terico; esto es:z c = 2.18 1.64 = z t2.18 est en la zona de rechazo de la hiptesis nula, luego queda aceptada la hiptesis de investigacin, esto es : El promedio de rendimiento del grupo A es superior al promedio de rendimiento del grupo B.Si el valor calculado est en la zona de rechazo de la hiptesis nula se rechaza la(s)hiptesis nula(s) y a su vez se acepta la(s) hiptesis de investigacin o viceversa.4.3.2t-studentCuando no se conoce la varianza poblacional, el mejor estadstico de prueba a utilizarse es t-student.DEF. La prueba t-student sirve para comparar (sobre una variable, por ejemplo rendimiento) la media de una muestra con la media de una poblacin; o evaluar si dos grupos difieren entre s de manera significativa respecto a sus medias.NOTA.- Algunos autores recomiendan utilizar t-student en muestras menores que 30, pero se puede aplicar tranquilamente en muestras un poco mayores a 30, cuando la distribucin es aproximadamente normal, siempre que se conozca la desviacin tpica o estndar muestral s.En el caso de una muestra A (con una distribucin muestral normal de la poblacin), se conocen x y s que es la desviacin estndar de la muestra. El valor calculado de t se obtiene con la frmula:x - mt = sdonde n-1 son los grados de libertad. EJEMPLO 1 n - 1En un curso de 20 estudiantes de la ESPOCH se ha obtenido un promedio x = 7.4 y una desviacin tpica s = 1.2.Pruebe con un nivel de significacin del 1% que este promedio no es significativamente diferente al promedio poblacional m = 7.11) Planteamiento de la hiptesisH i : m 7.1 (El promedio de rendimiento del grupo es diferente a 7.1)H o : m = 7.12) Nivel de significacina = 0.013) CriterioRechace H o si t c -2.86 o t c 2.86Donde 2.86 es el valor terico de t con 19 grados de libertad (ver APNDICE B), y t ces el valor calculado de t que se obtiene aplicando la frmula:x - mtc = sn - 14) ClculosReemplazando los datosx = 7.4 s = 1.2m = 7.1 n = 20en la frmula correspondiente, se obtiene:x - mtc = sn - 1 = 7.4 - 7.1 =1.219 0.30.2752 = 1.095) DecisinComo el valor calculado de t calculado es 1.09 se encuentra a la izquierda del valorterico que es 2.86, no se puede rechazar la H o ; esto es El promedio de rendimientodel grupo no es significativamente diferente a 7.1.En el caso de dos muestras A y B de las que se conocen las medias x A y x BsBArespectivamente, las varianzas muestrales2 y s 2 y con la hiptesis nula H o :mA = mB. Se utiliza el estadstico t- student,cuyo valor se calcula con la siguiente frmula:t c = x A - x B(n A - 1)s 2 + (n B - 1)s 2 1 1 ABn A + n B - 2 n A + n B donde n A + n B - 2 son los grados de libertad; n A nmero de elementos de A, n Bnmero de elementos de B. Mientras mayor sea el nmero de grados de libertad, la distribucin t se acerca ms a ser una distribucin normal.EJEMPLO 1En una prueba de rendimiento aplicada a dos grupos A de 20 alumnos que ha utilizado una nueva metodologa, y B de 17 alumnos que ha utilizado una metodologatradicional, se han obtenido los siguientes resultados: x A = 7.8, x B = 7.2, s A = 1, s B =1.2.Pruebe con un nivel de significacin = 0.05 que los promedios son significativamente diferentes.1) Planteamiento de las hiptesisH i : mA mB (El promedio de rendimiento del grupo A que ha utilizado una nueva metodologa es significativamente diferente al promedio de rendimiento del grupo B que ha utilizado la metodologa tradicional)H o : mA = mB ( El promedio de rendimiento del grupo A que ha utilizado una nueva metodologa no es diferente al promedio de rendimiento del grupo B que ha utilizado la metodologa tradicional)2) Nivel de significado = 0.053) CriterioBRechace la hiptesis nula si t c < - t t = -2.03 o bien t c > t t = 2.03donde t t es el valor terico de t con 35 grados de libertad y = 0.05 (ensayo a doscolas, ver Anexo 2), caso contrario acepte la de investigacin. de t que se obtiene aplicando la frmula: t c es el valor calculadot c = x A - x B(n A - 1)s 2 + (n B - 1)s 2 1 1 An A + n B - 2 n A + n B 4 ) ClculosLos datos son:x A = 7.8x B = 7.222s A = (1) = 122s B = (1.2) = 1.44n A = 20n B = 17estos datos se reemplazan en la frmula correspondiente del t-studentt c = x A - x BA(n A - 1)s 2 + (n B - 1)s 2 1 1 donde Bn A + n B - 2 n A + n B X A = promedio de rendimiento del grupo AX B = promedio de rendimiento del grupo de control BsA2 = varianza del grupo ABs 2 = varianza del grupo de control Bn A = nmero de elementos del grupo An B = nmero de elementos del grupo de control By se obtiene :t c = x A - x B = 7.8 - 7.2 = 0.6 = 4.6(n - 1)s 2 + (n - 1)s 2 1 1 (19)1 + (16)1.44 1 1 0.13A A B B + + nn B An A + n B - 2 35 20 17 5) DecisinComo t c = 4.6 > t t = 2.03, se rechaza la hiptesis nula y se acepta la de investigacin,esto es: El promedio de rendimiento del grupo A utilizando una nueva metodologa es significativamente diferente al promedio de rendimiento del grupo B utilizando la metodologa tradicional.4.3.3Prueba de diferencia de proporcionesSe utiliza para analizar (sobre una variable) si dos proporciones de dos grupos difieren significativamente entre s.La variable de los grupos debe ser medida en proporciones o porcentajes. Se aplica la siguiente frmula de puntuacin z para proporciones:z = p1 - p 2p1q1 + p 2 q 2donde: n1 n 2p1 proporcin del primer grupo y n 1 el nmero de sus elementosp 2 proporcin del segundo grupo y n 2 el nmero de sus elementosq1 = 1 - p1q 2 = 1 - p2EJEMPLOEn una prueba de rendimiento a dos grupos A y B de 30 y 27 alumnos respectivamente, se obtuvieron los siguientes resultados:Grupo A: porcentaje del 68% de muy buenos de un total de 30 estudiantesGrupo B: porcentaje del 40% de muy buenos de un total de 27 estudiantesPruebe que el porcentajes de muy buenos del grupo A es significativamente superior a porcentaje de muy buenos del grupo B.1) Planteamiento de las hiptesisH i : p1 > p2 (El porcentaje de muy buenos del grupo A es mayor que el del grupo B)H o : p1 =p2 (No hay diferencia entre los porcentaje de muy buenos del grupo A y del grupo B)2) Nivel de significacina = 0.053) CriterioRechace la H o si z c 1.64Donde 1.64 es el valor terico de z en un ensayo a una cola con un nivel designificacin de 0.05, y z cfrmula: es el valor calculado de z que se obtiene aplicando laz = p1 - p 2p1q1 + p 2 q 24) Clculos n1 n 2Reemplazando los datosp1 = 0.68; q1 = 1- 0.68 = 0.32; n 1 = 30; p 2 = 0.4; q 2 = 1 - 0.4 = 0.6; n 2en la frmula correspondiente, se obtiene: = 27z = p1 - p 2 =p1q1 + p 2 q 2 0.68 - 0.4(0.68)(0.32) + (0.4)(0.6) = 2.2n1n 2 30 275) DecisinComo el valor de z calculado es mayor al valor de z terico; esto es:z c = 2.2 1.64 = z t2.2 est en la zona de rechazo de la hiptesis nula, luego queda aceptada la hiptesis de investigacin, esto es : El porcentaje de muy buenos del grupo A es significativamente mayor que el del grupo B.4.3.4Chi cuadrado ( c 2 )Es una prueba (de significacin para anlisis no paramtrico) estadstica que se utiliza para evaluar hiptesis correlacionales que relacionan dos variables categricas. El nivel de medicin de las variables es nominal u ordinal (aplicada a sujetos).La c 2 se calcula utilizando una tabla cruzada de dos dimensiones, cada dimensincontiene una variable y cada variable se subdivide a la vez en dos o ms categoras.El c 2 calculado se obtiene con la siguiente frmula : c 2 = (f o - fe )fedonde2f o = frecuencia observadaf e = frecuencia esperadaEJEMPLO 1Determinar si el voto de apoyo o no al gobierno depende del gnero.Luego de la respectiva investigacin y aplicacin de la encuesta, la tabulacin de los datos se presenta en el siguiente cuadro.RESULTADOS DE LA ENCUESTA APLICADA A 76 PERSONAS (HOMBRES Y MUJERES) RESPECTO AL APOYO O NO AL GOBIERNOVOTO DE APOYO O NO AL GOBIERNOSEXOapoyanno apoyanTotalmasculino281644femenino151732Total433376Por ser un estudio de tipo correlacional, la prueba se la realiza con el CHI- CUADRADO.Estos son los pasos que se han utilizado para ello:1) Planteamiento de las hiptesisctH i : 2 2 (Hay relacin entre la variable voto de apoyo o no al gobiernoy lavariable voto masculino y femenino (o, la variable voto de apoyo o no al gobierno,depende de la variable voto masculino y femenino)).ctH 0 : 2 = 2 (No hay relacin entre la variable voto de apoyo o no al gobierno y lavariable voto masculino y femenino ( o, la variable voto de apoyo o no al gobierno, no depende de la variable voto masculino y femenino)).2) Nivel de significacina = 0.053) CriterioctRechace la H 0 si c 2 c 2 = 3.84GL = (renglones-1)(columnas-1) = (2-1)(2-1) = 14) ClculosDatos: En una encuesta a 76 personas (hombres y mujeres) respecto al apoyo o no al gobierno, se obtuvieron los siguientes resultadovoto de apoyo o no al gobiernosexoapoyanno apoyanTotalmasculino281644femenino151732Total433376las frecuencias esperadas de los datos se calculan as: f (28) = (44)(43)e76 = 24.9f e (16) = (44)(33)276 = 19.1; f e (15) = (32)(43)76 = 18.1; f e (17) = (32)(33)76 = 13.9Indiquemos en un cuadro las celdas con todos los datos necesarios y hallemos c 2Celdaf of ef o - f e(f o - f e )(f o - f e )f emasculino de apoyo2824.93.19.610.3859masculino no apoyo1619.1-3.19.610.5031femenino de apoyo1518.1-3.19.610.5309femenino no apoyo1713.93.19.610.69142.112 2cLuego, c 2 = (f o - f e ) = 2.11f eLos grados de libertad (GL) se obtiene con la frmula:GL = (renglones-1)(columnas-1) = (2-1)(2-1) = 1cgrfico de la interpretacin de c 2c 2 = 2.11 c 2 0.95, 1= 3.845) DecisinCon n = 1 grado de libertad y con un nivel de significacin a = 0.05 se obtiene un valortterico c 2 = c 2 0.05, 1 = 3.84 (Anexo 3). En vista de que c 2 = 2.11