15 spss comparacion de medias

Preview:

Citation preview

Marzo 2011Profesor: Carlos Rojas A. – MBAConsultor | Media Management

Una forma natural para comparar 2 grupos es un diagrama de caja de los datos para ambos grupos. Por ejemplo:

Medias Prueba T para una muestra Prueba T para dos muestras

independientes Prueba T para dos muestras relacionadas.

Una vez que se han examinado los boxplots, podemos enfrentarnos a una comparación de dos medias.

Al comparar dos medias el parámetro es la diferencia entre dos medias, 1 – 2.

La cantidad es nuestro mejor estimador de la diferencia entre ambas medias

1 2y y

2 21 2

1 21 2

s sSE y y n n

Recordemos que para valores independientes la desviación estándar es:

Así el error estándar es:

Porque estamos trabajando con medias y estimando el error estándar de los datos usados, el modelo de muestreo es t-student

2 21 2

1 21 2

SD y y n n

Supuesto de población normal: Condición de normalidad (revisar para

ambas muestras)Supuesto de grupos independientes:

los grupos que estamos comparando deben ser independientes uno del otro

Supuesto de igualdad de varianzas: dependiendo del valor del calculo se

trabaja con medias independientes o relacionadas

Entrega estadísticos descriptivos que pueden calcularse para los distintos grupos y sub grupos definidos para una o más variables independientes. Anova de un factor Proporción de la varianza explicada Hipótesis de linealidad

Esta prueba permite el contraste referido a una media poblacional

Se hace necesario estimar la DS muestral

Al trabajar con la DS muestral, obliga a usar t

Esta tipificación en t, del estadístico Ŷ (media), es lo que se llama prueba t para una muestra

Su beneficio es conocer la probabilidad asociada a cada uno de los valores y que puede obtener de una muestra N. El verdadero valor μ S = desviación poblacional

Para que el estadístico T se ajuste a t Población normal A más de 20 o 30 casos

El nivel crítico indica la probabilidad de obtener una media Ŷ tan alejada de μ como la de hecho obtenida μ es un valor propuesto en “Valor de

Prueba”Si esa probabilidad es menor que

0,05, entonces se rechaza la hipótesis nula de que la media poblacional es el valor propuesto

Normalidad: las muestras con que se trabaja proceden de poblaciones normalmente distribuidas

Homocedasticidad u homogeneidad de varianzas: todas esas poblaciones normales poseen la misma varianza

Spss entrega 2 pruebas de significación: Kolmogorov-Smirnov Shapiro-Wilk (= ó < que 50 obs.)

Spss entrega 2 gráficos de normalidad: Q-Q Normal Q-Q Normal sin tendencia

Los estadísticos permiten contrastar la hipótesis nula de que los datos muestrales proceden de poblaciones normales: se rechaza la hipótesis nula de normalidad cuando el nivel crítico (.sig) es menor que el nivel de significancia establecido, (generalmente 0,05 o 5%)

Los estadísticos son muy sensibles a los puntos extremos, por lo que hay que acompañarlos de sus respectivas gráficas

Spss entrega 2 gráficos de normalidad: Q-Q Normal Q-Q Normal sin tendencia

Explorar > gráficos con pruebas de normalidad

Q-Q Normal: desviaciones de la línea diagonal indican desviaciones de la normalidad

Q-Q Normal sin tendencia: si la muestra proviene de una población normal entonces los datos deben oscilar aleatoriamente en torno a la horizontal La presencia de patrones, indican desviaciones

de la normalidad

Permite contrastar la hipótesis referida a las diferencias entre dos medias independientes Dos poblaciones normales Muestras Independientes

La prueba T permite contrastar la diferencia entre dos medias muestrales tipificadas

Se usan las medias muestrales para contrastar la hipótesis nula de que las medias poblacionales son iguales

Se puede usar iguales varianzas o diferentes varianzas Prueba de Levene de Homogeneidad▪ Entrega información para ambos casos

Normalidad: las muestras con que se trabaja proceden de poblaciones normalmente distribuidas

Homocedasticidad u homogeneidad de varianzas: todas esas poblaciones normales poseen la misma varianza

Spss entrega la prueba de significación de Levene

Spss entrega el gráficos de dispersión por nivel

La prueba de Levene contrasta la hipótesis que los grupos definidos por la variable factor proceden de poblaciones con la misma varianza

Esta prueba consiste en hacer una análisis de varianza de un factor utilizando como variable dependiente la diferencia, en valor absoluto, entre cada puntuación individual y la media

Spss entrega la prueba de significación de Levene: El nivel crítico asociado al estadístico

de Levene permite contrastar la hipótesis de homogeneidad de las varianzas

Si el valor crítico es menor que 0,05, se debe rechazar la hipótesis de homogeneidad

La prueba T para muestras relacionadas, permite contrastar la hipótesis referida a la diferencia entre dos medias relacionadas Se dispone de una población a la cual se

le quiere medir:▪ Dos variables diferentes▪ La misma variable en dos momentos

diferentes

Desde una perspectiva estadística es igual a “prueba T para una muestra”

Ahora se tienen 2 muestras relacionadas o pares de puntuaciones

La hipótesis nula es que hay igualdad entre las medias de dos variables

Al revisar la sig., entonces si es menor que 0,05 se rechaza la hipótesis nula de igualdad, por lo que habría diferencias significativas entre estas dos variable elegidas

El supuesto de independencia requiere especial preocupación

Revisen los gráficos, busquen puntos extremos y distribuciones no normales diagramas de caja

Email: carlosrojasarancibia@gmail.comBlog: economiaymedios.blogspot.comTwitter: reds_clSlideshare: www.slideshare.net/reds_cl LinkedIn: http://cl.linkedin.com/in/carlosrojasaSkype: reds_cl

Muchas Gracias

Marzo 2011Profesor: Carlos Rojas A. – MBAConsultor | Media Management