70
TEMA 4 FASE ESTADÍSTICO-ANALÍTICA: RECURSOS PARA EL ANÁLISIS DE DATOS

TEMA 4 FASE ESTADÍSTICO-ANALÍTICA: …ocw.usal.es/eduCommons/ciencias-sociales-1/recursos-instrumentales... · Curvilínea . A.de Regresión Múltiple . A.de Regresión Lineal Simple

  • Upload
    lamhanh

  • View
    216

  • Download
    0

Embed Size (px)

Citation preview

TEMA 4

FASE ESTADÍSTICO-ANALÍTICA:

RECURSOS PARA EL ANÁLISIS DE DATOS

FASES EN EL ANÁLISIS DE LOS DATOS DE UNA INVESTIGACIÓN

SELECCIÓN

Modelo de Análisis

Técnica de Análisis HIPÓTESIS DE INVESTIGACIÓN

VARIABLES

Planteamiento de las hipótesis estadísticas

REALIZACIÓN DEL ANÁLISIS

Generación de la matriz de datos

Preparación de los datos:

Diagnóstico

Técnica de análisis

RESULTADOS

Interpretación de la salida de resultados

Presentación de resultados y

su representación gráfica

PAQUETE ESTADÍSTICO

PRESENTACIÓN DE RESULTADOS EN

UN TRABAJO DE INVESTIGACIÓN (Tesis, artículo, memoria investigación…)

1. SELECCIÓN. A) SELECCIÓN DEL MODELO DE ANÁLISIS

HIPÓTESIS DE INVESTIGACIÓN

MODELO DE ANÁLISIS

¿Existen diferencias entre dos grupos?

¿Produce mejora un tratamiento?

¿Es una variable buena predictora de otra?

¿Es lineal la relación entre dos variables?

MODELO ESTRUCTURAL O DE EFECTOS

Contraste t

Análisis de la Varianza (ANOVA)

MODELO DE REGRESIÓN

Análisis de Regresión Lineal Simple

MODELO ESTRUCTURAL O DE EFECTOS

B) SELECCIÓN DE LA TÉCNICA DE ANÁLISIS.

NIVELES DE LA VI

Dos niveles

Más de dos niveles

ANOVA Contraste t de diferencias de medias

Diferencias entre grupos Diferencias entre medidas

Contraste t de diferencias de medias

para muestras independientes

Contraste t de diferencias de medias

para muestras relacionadas

C) PLANTEAMIENTO DE LAS HIPÓTESIS ESTADÍSTICAS.

HIPÓTESIS DE INVESTIGACIÓN HIPÓTESIS DE INVESTIGACIÓN

HIPÓTESIS ESTADÍSTICAS

Contraste t de diferencia de medias para muestras independientes

Contraste t de diferencia de medias para muestras relacionadas

Diferencias en la VD entre grupos

Diferencias en la VD entre medidas

Un grupo superior o inferior a otro en la VD

Una medida en la VD superior o inferior a otra

Hipótesis estadísticas bidireccionales

Hipótesis estadísticas unidireccionales

D) REALIZACIÓN DEL ANÁLISIS. - Generación de la Matriz de datos.

Contraste t de diferencia de medias para muestras independientes

ANOVA

VI VD Categórica Cuantitativa

Niveles

de la

VI

Puntuaciones

en la

VD

Contraste t de diferencia de medias para muestras relacionadas

VD VD 1ª Medida 2ª Medida Cuantitativa Cuantitativa

Puntuaciones

en la

VD

Puntuaciones

en la

VD

- Preparación de los datos.

Tratamiento de las omisiones

Adecuación del nivel de medida de la VI

CATEGORIZACIÓN

Cuantitativa Categórica

Detección y tratamiento de los casos extremos

- Diagnóstico.

a) Normalidad:

-N. Univariable: Representación gráfica de la VD: Histograma (Ajuste a la curva normal) Caja y patillas

Índices de forma de la VD: Asimetría (As≈0) Curtosis (K≈0)

Prueba de bondad de ajuste sobre la VD (p>0,05 ó p>0,01) -N. Bivariable: Representación gráfica de la VD para cada nivel de la VI: Histograma (Ajuste a la curva normal)

Caja y patillas Índices de forma de la VD para cada nivel de la VI: Asimetría (As≈0)

Curtosis (K≈0)

Prueba de bondad de ajuste sobre la VD para cada nivel de la VI (p>0,05 ó p>0,01)

b) Homocedasticidad: Prueba de Levene (p>0,05 ó p>0,01)

Relación significativa entre las dos medidas (contraste t de diferencia de medias para muestras relacionadas

E) PRESENTACIÓN DE LOS RESULTADOS DEL ANÁLISIS

Contraste t diferencia de medias para muestras independientes y relacionadas ANOVA

(t(gl)=…. , p=….., eta2=…..) (F(gl1,gl2)=…. , p=….., eta2=…..)

Tabla de descriptivos

Tabla 1.- Descriptivos en la VD para los distintos niveles en la VI.

VI n M D.T.

Niveles de la VI

Nº de sujetos

Media en la VD para

cada grupo o medida

Desviación Típica en la

VD para cada grupo o medida

Total

Representación gráfica

Figura 1. Medias en la VD para los diferentes niveles en la VI.

Niveles de la VI

VD

MODELO DE REGRESIÓN

B) SELECCIÓN DE LA TÉCNICA DE ANÁLISIS.

Nº de VI

TIPO DE RELACIÓN

Una

Más de una

Lineal

Curvilínea

A.de Regresión Múltiple

A.de Regresión Lineal Simple

A.de Regresión Polinómica

C) PLANTEAMIENTO DE LAS HIPÓTESIS ESTADÍSTICAS. HIPÓTESIS DE INVESTIGACIÓN

HIPÓTESIS ESTADÍSTICAS

Relación lineal VI-VD

VI buen predictor diferencias VD

Hipótesis sobre el coeficiente de regresión

Hipótesis sobre la proporción de varianza explicadas

D) REALIZACIÓN DEL ANÁLISIS. - Generación de la Matriz de datos.

Análisis de Regresión Lineal Simple

VI VD Cuantitativa Cuantitativa

Puntuaciones

en la

VI

Puntuaciones

en la

VD

- Preparación de los datos.

Tratamiento de las omisiones

Detección y tratamiento de los casos extremos

- Diagnóstico.

a) Normalidad:

-N. Univariable: Representación gráfica de las VI y VD: Histograma (Ajuste a la curva normal) Caja y patillas

Índices de forma de las VI y VD: Asimetría (As≈0) Curtosis (K≈0)

Prueba de bondad de ajuste sobre las VI y VD (p>0,05 ó p>0,01) -N. Bivariable: Representación gráfica de los errores: Histograma (Ajuste a la curva normal)

Caja y patillas

Índices de forma de los errores: Asimetría (As≈0) Curtosis (K≈0)

Prueba de bondad de ajuste sobre los errores (p>0,05 ó p>0,01)

b) Linealidad: Representación gráfica: Diagrama de dispersión. Índice estadístico: Coeficiente de correlación de Pearson. Pruebas t y F (p<0,05 ó p<0,01)

c) Homocedasticidad, Linealidad y Normalidad: Representación de errores sobre puntuaciones pronosticadas.

E) PRESENTACIÓN DE LOS RESULTADOS DEL ANÁLISIS

Prueba t sobre el Coeficiente de Regresión Prueba F del ANOVA de la Regresión (t(gl)=…. , p=….) (F(gl1,gl2)=…. , p=….., R2=…..)

Tabla de descriptivos

Tabla 1.- Descriptivos de las VI y VD.

Variables n M D.T.

VI

VD

Nº de sujetos

Media en las VI y VD

Desviación Típica en las

VI y VD

Total

Representación gráfica

Figura 1. Recta de regresión de la VD sobre la VI.

VI

VD

ANÁLISIS DE DATOS: LOS PAQUETES ESTADÍSTICOS

ENTORNO PC ENTORNO MACINTOSH

STATGRAPHICS

SAS

BMDP

STATVIEW

SYSTAT

SPSS

COMPONENTES DE LOS PAQUETES ESTADÍSTICOS

GENERACIÓN DE LA MATRIZ DE DATOS

PREPARACIÓN DE LA MATRIZ DE DATOS

TÉCNICAS DE ANÁLISIS

Y REPRESENTACIONES GRÁFICAS

ANÁLISIS DE DATOS CON EL

PAQUETE ESTADÍSTICO SPSS

PAQUETE ESTADÍSTICO SPSS.

1. GENERACIÓN DE LA MATRIZ DE DATOS.

A) DEFINICIÓN DE LAS VARIABLES: VISTA DE VARIABLES.

- Variables nominales o categóricas.

- Variables cuantitativas.

- Introducción de datos: Vista de datos.

2. PREPARACIÓN DE LA MATRIZ DE DATOS

A) TRATAMIENTO DE LAS OMISIONES.

B) DETECCIÓN Y TRATAMIENTO DE LOS CASOS EXTREMOS.

- Detección de los casos extremos: exploración de los datos

1010N =

C.PRESEN

c.derechoc.izquierdo

MSG

S

600

500

400

300

200

3

- Eliminación de los casos extremos del análisis: seleccionar casos.

C) ADECUACIÓN DEL NIVEL DE MEDIDA DE LA VI: CATEGORIZACIÓN.

-Establecer los puntos de corte: Percentiles

Estadísticos

MSGS20

0453,65473,50

74,765589,61

-1,060,512,966,992271561

395,80413,25453,80473,50486,60501,75510,80

VálidosPerdidos

N

MediaMedianaDesv. típ.VarianzaAsimetríaError típ. de asimetríaCurtosisError típ. de curtosisMínimoMáximo

20254050607580

Percentiles

-Categorizar: Recodificar

Variable categorizada

3. TÉCNICAS DE ANÁLISIS Y REPRESENTACIONES GRÁFICAS

A) Contraste t de diferencia de medias para muestras independientes.

- Matriz de datos.

- Diagnóstico.

a) Normalidad: Nivel univariable.

Descriptivos

Estadístico Error típ.

msgs Asimetría -,198 ,536

Curtosis -,797 1,038

Pruebas de normalidad

Kolmogorov-Smirnova Shapiro-Wilk

Estadístico gl Sig. Estadístico gl Sig.

msgs ,124 18 ,200* ,962 18 ,636

a. Corrección de la significación de Lilliefors

*. Este es un límite inferior de la significación verdadera.

a) Normalidad: Nivel bivariable.

Descriptivos

c.presen Estadístico Error típ.

c.izquierdo Asimetría -,267 ,717

Curtosis ,689 1,400

c.derecho Asimetría ,206 ,717

Curtosis -1,479 1,400

Pruebas de normalidad

c.presen Kolmogorov-Smirnova Shapiro-Wilk Estadístico gl Sig. Estadístico gl Sig.

msgs c.izquierdo ,128 9 ,200* ,978 9 ,951

c.derecho ,157 9 ,200* ,939 9 ,567

a. Corrección de la significación de Lilliefors

*. Este es un límite inferior de la significación verdadera.

b) Homocedasticidad.

Prueba de homogeneidad de la varianza

Estadístico de

Levene gl1 gl2 Sig.

msgs Basándose en la media ,997 1 16 ,333

Basándose en la mediana. ,927 1 16 ,350

Basándose en la mediana y

con gl corregido

,927 1 15,700 ,350

Basándose en la media

recortada

,982 1 16 ,336

- Técnica de análisis: Prueba de significación estadística.

- Salida de resultados del análisis.

Descriptivos de los grupos: Estadísticos de grupo

9 496,11 41,01 13,679 448,56 49,14 16,38

C.PRESENc.izquierdoc.derecho

MSGSN Media

Desviacióntíp.

Error típ. dela media

Resultados del análisis:

Prueba de muestras independientes

,997 ,333 2,229 16 ,040 47,56 21,33 2,33 92,78

2,229 15,504 ,041 47,56 21,33 2,21 92,90

Se han asumidovarianzas igualesNo se han asumidovarianzas iguales

MSGSF Sig.

Prueba de Levenepara la igualdad de

varianzas

t gl Sig. (bilateral)Diferenciade medias

Error típ. dela diferencia Inferior Superior

95% Intervalo deconfianza para la

diferencia

Prueba T para la igualdad de medias

Comprobación del supuesto de homocedasticidad t (16) = 2,23; p = 0,04 (Contraste bilateral)

p = 0,02 (Contraste unilateral)

- Representación gráfica de los resultados.

C.PRESEN

c.derechoc.izquierdo

Med

ia d

e M

SG

S

500

490

480

470

460

450

440

C.PRESEN

c.derechoc.izquierdo

Med

ia d

e M

SG

S

500

490

480

470

460

450

440

B) Análisis de Varianza de un factor inter (ANOVA de un factor inter)

- Matriz de datos:

- Diagnóstico.

a) Normalidad: Nivel univariable.

Descriptivos

Estadístico Error típ.

precord Asimetría ,069 ,427

Curtosis -1,104 ,833

Pruebas de normalidad

Kolmogorov-Smirnova Shapiro-Wilk

Estadístico gl Sig. Estadístico gl Sig.

precord ,126 30 ,200* ,949 30 ,163

a. Corrección de la significación de Lilliefors

*. Este es un límite inferior de la significación verdadera.

a) Normalidad: Nivel bivariable.

PRECORD

10,08,06,04,02,0

Para ENTRENAM= G. Control

Frec

uenc

ia

5

4

3

2

1

0

Desv. típ . = 2,83

Media = 5,3

N = 10,00

PRECORD

18,016,014,012,010,08,0

Para ENTRENAM= Tipo A

Frec

uenc

ia

3,5

3,0

2,5

2,0

1,5

1,0

,5

0,0

Desv. típ. = 3,86 Media = 12,0

N = 10,00

PRECORD

20,018,016,014,012,010,08,0

Para ENTRENAM= Tipo B

Frec

uenc

ia

2,5

2,0

1,5

1,0

,5

0,0

Desv. típ. = 4,00 Media = 14,7

N = 10,00

101010N =

ENTRENAM

Tipo BTipo AG. Control

PRE

CO

RD

30

20

10

0

Descriptivos

entrenam Estadístico Error típ.

precord G. Control Asimetría ,612 ,687

Curtosis -1,162 1,334

Tipo A Asimetría ,261 ,687

Curtosis -1,797 1,334

Tipo B Asimetría -,388 ,687

Curtosis -,961 1,334

Pruebas de normalidad

,192 10 ,200* ,901 10 ,286,202 10 ,200* ,884 10 ,187,131 10 ,200* ,955 10 ,702

ENTRENAMG. ControlTipo ATipo B

PRECORDEstadístico gl Sig. Estadístico gl Sig.

Kolmogorov-Smirnova Shapiro-Wilk

Este es un límite inferior de la significación verdadera.*.

Corrección de la significación de Lillieforsa.

a) Homocedasticidad.

Prueba de homogeneidad de la varianza

1,013 2 27 ,377

,511 2 27 ,606

,511 2 24,917 ,606

1,012 2 27 ,377

Basándose en la mediaBasándose en lamediana.Basándose en lamediana y con glcorregidoBasándose en la mediarecortada

PRECORD

Estadísticode Levene gl1 gl2 Sig.

- Técnica de análisis: Prueba de significación estadística.

- Salida de resultados del análisis.

Descriptivos de los grupos: Descriptivos

PRECORD

10 5,30 2,83 ,90 3,28 7,32 2 1010 12,00 3,86 1,22 9,24 14,76 7 1710 14,70 4,00 1,27 11,84 17,56 8 2030 10,67 5,31 ,97 8,68 12,65 2 20

G. ControlTipo ATipo BTotal

N MediaDesviación

típica Error típico Límite inferiorLímite

superior

Intervalo de confianza parala media al 95%

Mínimo Máximo

Comprobación del supuesto de homocedasticidad:

Prueba de homogeneidad de varianzas

PRECORD

1,013 2 27 ,377

Estadísticode Levene gl1 gl2 Sig.

Resultados del análisis: ANOVA

PRECORD

468,467 2 234,233 18,059 ,000350,200 27 12,970818,667 29

Inter-gruposIntra-gruposTotal

Suma decuadrados gl

Mediacuadrática F Sig.

F (2,27) = 18,06; p < 0,01

- Comparaciones post hoc o a posteriori.

Comparaciones múltiples

Variable dependiente: PRECORD

-6,70* 1,61 ,001 -10,69 -2,71-9,40* 1,61 ,000 -13,39 -5,416,70* 1,61 ,001 2,71 10,69

-2,70 1,61 ,232 -6,69 1,299,40* 1,61 ,000 5,41 13,392,70 1,61 ,232 -1,29 6,69

-6,70* 1,61 ,001 -10,87 -2,53-9,40* 1,61 ,000 -13,57 -5,236,70* 1,61 ,001 2,53 10,87

-2,70 1,61 ,263 -6,87 1,479,40* 1,61 ,000 5,23 13,572,70 1,61 ,263 -1,47 6,87

(J) ENTRENAMTipo ATipo BG. ControlTipo BG. ControlTipo ATipo ATipo BG. ControlTipo BG. ControlTipo A

(I) ENTRENAMG. Control

Tipo A

Tipo B

G. Control

Tipo A

Tipo B

HSD de Tukey

Scheffé

Diferencia demedias (I-J) Error típico Sig. Límite inferior

Límitesuperior

Intervalo de confianza al95%

La diferencia entre las medias es significativa al nivel .05.*.

- Tamaño del efecto.

Pruebas de los efectos inter-sujetos

Variable dependiente: PRECORD

468,467b 2 234,233 18,059 ,000 ,572 36,118 1,0003413,333 1 3413,333 263,164 ,000 ,907 263,164 1,000

468,467 2 234,233 18,059 ,000 ,572 36,118 1,000350,200 27 12,970

4232,000 30818,667 29

FuenteModelo corregidoIntersecciónENTRENAMErrorTotalTotal corregida

Suma decuadrados

tipo III glMedia

cuadrática F Significación Eta cuadradoParámetro deno centralidad

Potenciaobservadaa

Calculado con alfa = ,05a.

R cuadrado = ,572 (R cuadrado corregida = ,541)b.

- Representación gráfica de los resultados.

ENTRENAM

Tipo BTipo AG. Control

Med

ia d

e PR

ECO

RD

16

14

12

10

8

6

4

ENTRENAM

Tipo BTipo AG. Control

Med

ia d

e PR

ECO

RD

16

14

12

10

8

6

4

C) Contraste t de diferencia de medias para muestras relacionadas.

- Matriz de datos:

Diagnóstico.

a) Normalidad: Nivel bivariable.

Descriptivos

Estadístico Error típ.

derecho Asimetría ,192 ,616

Curtosis -1,128 1,191

izquierd Asimetría ,184 ,616

Curtosis -1,000 1,191

Pruebas de normalidad

Kolmogorov-Smirnova Shapiro-Wilk

Estadístico gl Sig. Estadístico gl Sig.

derecho ,132 13 ,200* ,943 13 ,502

izquierd ,109 13 ,200* ,955 13 ,679

a. Corrección de la significación de Lilliefors

*. Este es un límite inferior de la significación verdadera.

b) Relación significativa entre las dos medidas.

- Técnica de análisis: Prueba de significación estadística.

- Salida de resultados del análisis.

Descriptivos de los grupos:

Estadísticos de muestras relacionadas

497,54 13 119,70 33,20508,38 13 124,11 34,42

DERECHOIZQUIERD

Par 1Media N

Desviacióntíp.

Error típ. dela media

Relación entre las medidas

Correlaciones de muestras relacionadas

N Correlación Sig.

Par 1 derecho y izquierd 13 ,993 ,000

Resultados del análisis:

Prueba de muestras relacionadas

-10,85 14,71 4,08 -19,73 -1,96 -2,659 12 ,021DERECHO - IZQUIERDPar 1Media

Desviacióntíp.

Error típ. dela media Inferior Superior

95% Intervalo deconfianza para la

diferencia

Diferencias relacionadas

t gl Sig. (bilateral)

t (12) = -2,66; p = 0,021 (Contraste bilateral) p = 0,0105 (Contraste unilateral)

- Representación gráfica de los resultados.

C.VISUAL

IzquierdoDerecho

Med

ias

TR

510

508

506

504

502

500

498

496

C.VISUAL

IzquierdoDerecho

Med

ias

TR

510

508

506

504

502

500

498

496

D) Análisis de regresión lineal simple.

- Matriz de datos:

- Diagnóstico. a) Normalidad a nivel Univariable.

EP

62,560,0

57,555,0

52,550,0

47,545,0

42,540,0

37,535,0

Frec

uenc

ia

7

6

5

4

3

2

1

0

Desv. típ. = 7,43 Media = 47,3

N = 34,00

34N =

EP

70

60

50

40

30

EF

200,0180,0

160,0140,0

120,0100,0

80,060,0

40,0

Frec

uenc

ia

12

10

8

6

4

2

0

Desv. típ. = 35,81 Media = 105,5

N = 34,00

34N =

EF

300

200

100

0

Pruebas de normalidad

,117 34 ,200* ,965 34 ,433,112 34 ,200* ,975 34 ,668

EPEF

Estadístico gl Sig. Estadístico gl Sig.Kolmogorov-Smirnova Shapiro-Wilk

Este es un límite inferior de la significación verdadera.*.

Corrección de la significación de Lillieforsa.

a) Normalidad a nivel Bivariable.

Regresión Residuo tipificado

3,002,50

2,001,50

1,00,50

0,00-,50

-1,00-1,50

-2,00

Frec

uenc

ia

12

10

8

6

4

2

0

Desv. típ. = ,98 Media = 0,00

N = 34,00

b) Linealidad.

EP

7060504030

EF

200

180

160

140

120

100

80

60

40

20

c) Linealidad, homocedasticidad y normalidad bivariable:

Regresión Valor pronosticado tipificado

3210-1-2

Regr

esión

Res

iduo t

ipific

ado

4

3

2

1

0

-1

-2

-3

- Técnica de análisis: Prueba de significación estadística.

- Salida de resultados del análisis.

Resumen del modelo

,671a ,450 ,433 26,97Modelo1

R R cuadradoR cuadradocorregida

Error típ. de laestimación

Variables predictoras: (Constante), EPa.

ANOVAb

19054,121 1 19054,121 26,202 ,000a

23270,350 32 727,19842324,471 33

RegresiónResidualTotal

Modelo1

Suma decuadrados gl

Mediacuadrática F Sig.

Variables predictoras: (Constante), EPa.

Variable dependiente: EFb.

Coeficientesa

-47,531 30,257 -1,571 ,1263,234 ,632 ,671 5,119 ,000

(Constante)EP

Modelo1

B Error típ.

Coeficientes noestandarizados

Beta

Coeficientesestandarizados

t Sig.

Variable dependiente: EFa.

F (1,32) = 26,20; p = ,000; R2=0,45 t (32)=5,12, p=.000

- Representación gráfica de los resultados.

EP

7060504030

EF200

180

160

140

120

100

80

60

40

20

EP

7060504030

EF

200

180

160

140

120

100

80

60

40

20