Upload
others
View
4
Download
0
Embed Size (px)
Citation preview
¿Cómo analizar un experimento en R?
Un primer vistazo
Programa
● Experimento
● Método experimental
● Noción de variable
● Estadística descriptiva e inferencia estadística
● Análisis de un experimento en R
Método experimental
http://liceu.uab.es/~joaquim/phonetics/fon_met_exper/met_exp_fon.html#metodo_fonetica
Noción de variable
Noción de variable
● Escalas de medidas
● Variables dependientes, independientes y controladas
● Niveles en las variables
● Muestras inter- e intra-sujetos
Escalas de medidas
Escalas de medida
● Variables cuantitativas (numéricas)= Variables que pueden medirse, cuantificarse o
expresarse numéricamente
● Variables cualitativas (categóricas)= Variables que representan una cualidad o atributoque clasifica a cada caso en una de varias categorías
Escalas de medida
● Variables cualitativas (categóricas) (cont.)● Variables nominales●Variables en las que las categorías no mantienen
una relación de orden entre sí● Ej: sexo, color de los ojos, profesión, presencia/ausencia
de una característica, etc.
● Variables ordinales●Variables en las que existe cierto orden o jerarquía
entre las categorías● Ej: evaluación ("Excelente", "Bueno", "Malo", "Muy malo"),
posición en una carrera (1ero, 2do, etc.)
Escalas de medida: Ejercicio
Indique de qué tipo de variable se trata (numérica, nominal u ordenal):1. Posición en una carrera
2. Distancia en metros3. Temperatura
4. Peso en kilos5. Origen del locutor (Costa Rica/España)6. Respuesta "Sí/No" a una pregunta
Variables dependientes, independientes y controladas
Noción de variable
● Dependientes● "Lo que medimos"
● Ej. Porcentaje de identificación correcta, tiempo de reacción, duración silábica, tipo de errores de pronunciación, etc.
Noción de variable
● Independientes● Factores que afectan la variable dependiente
Ej. Lengua materna, competencia en L2, procedencia geográfica, contexto fonético, valores de los parámetros acústicos, etc.
Noción de variable
● Controladas●Neutralización de factores que pueden tener
influencia sobre la variable dependiente
● Ej. Lengua materna, procecendia geográfica, edad, sexo, nivel socio-educativo, etc.
Noción de variables: Ejercicio
En un experimento medimos el tiempo necesario para reconocer unas palabras concretas y unas palabras abstractas. Sólo consideramos palabras con poca frecuencia y palabras de más de tres sílabas. Indique:● La variable dependiente● La variable independiente
● Las variables controladas
Niveles en las variables
Niveles en las variables
● Variables categóricas
● =¿Cuántas categorías en la variable?● =¿Cuántos grupos en la variable?
Niveles en las variables
Ejemplo 1En un experimento de percepción del acento, losparticipantes oyen unas palabras de 3 sílabas y tienenque indicar lo más rápidamente posible la posición delacento. Las palabras son esdrújulas, llanas o agudas. Examinamos el tiempo de reacción (TR) para las respuestas correctas. ¿Existe una diferencia de TR entre los tres patrones acentuales?
Variable dependiente:Variable independiente:
Niveles en las variables
Ejemplo 2Hemos medido la velocidad de articulación en unoslocutores suizos, belgas y franceses. Tambiénexaminamos si existe una diferencia entre la velocidad de articulación de los hombres y de las mujeres. ¿Existe unadiferencia de velocidad de articulación entre las 3 regiones? ¿Existe una diferencia entre los hombres y las mujeres?
Variable dependiente:Variables independientes:
Muestras inter- e intra-sujetos
Muestras inter- e intra-sujetos
● "Between-groups"
● "Within-subject" ("repeated measures", medidas repetidas)
Muestras inter- e intra-sujetos
● Muestras inter-sujetos:● "Individuos" diferentes en los grupos
Ejemplos: ● Participantes sanos y pacientes afásicos● Participantes que oyen habla natural y otros que oyen "sasasa"
xx
x
x
x x
xx xxx
x
ooo
ooo
oo o oo
o
Grupo A
Grupo B
Los "individuos" del grupo A no son los mismos que los individuos delgrupo B.
Muestras inter- e intra-sujetos
● Muestras intra-sujetos:●Mismos "individuos" en los grupos
Ejemplos: ● Producción de palabras antes y después de un entrenamiento● Participantes que oyen habla natural y "sasasa"
Los "individuos" del grupo A son los mismos individuos que los delgrupo B.
xx
x
x
x x
xx xxx
xoo
ooo
o
oo o oo
o
S1
S3
S2
S4
Grupo A Grupo B
Muestras inter- e intra-sujetos: Ejercicio
¿Son muestras inter- o intra-sujetos en estosestudios?1. Se examina la percepción de la vocal
francesa /y/ antes y después de un entrenamiento.
2. Se compara la percepción de la vocal francesa /y/ en hispanohablantes y en italanohablantes.
3. Se compara la velocidad de elocución en dos tareas: lectura y habla espontánea.
Resumen
● El diseño de un experimento implicadeterminar:
● La variable dependiente y su escala de medida
● La(s) variable(s) independiente(s) y su escala de medida
Ejercicios
Experimento● Objetivo 1: determinar si la percepción de la
velocidad de elocución depende de la lenguamaterna
Variable dependiente:Variable independiente:
Ejercicios
Experimento● Objetivo 2: determinar si la percepción de la
velocidad de elocución está relacionada con la percepción de un acento regional
Variable dependiente:Variable independiente:
Tratamiento estadístico
● Estadística descriptiva●Representación gráfica●Medidas de tendencia central y de dispersión
● Inferencia estadística (prueba de hipótesis)
Estadística descriptiva
Estadística descriptiva
● Representación gráfica de la distribución de los datos
� ¿Cómo se distribuyen los datos?
●Diagramas de barras (variables categóricas)
●Histogramas (variables numéricas)● Boxplot (variables numéricas)
Estadística descriptiva
0
1
2
3
4
5
6
7
8
C2 C1 B2 B1 A2 A1
Nivel
Fre
cuen
cia
abso
luta
0
2
4
6
8
10
12
14
100 200 300 400 500 600 700 800 900 1000
Durée des pauses
Fré
quen
ce
Diagrama de barras Histograma
Boxplot
Estadística descriptiva
● Medidas de tendencia central
� ¿Alrededor de qué valor se agrupan losdatos?
●Media (variables numéricas)
●Mediana (variables numéricas e ordinales)●Modo (variables categóricas)
Estadística descriptiva
● Medidas de dispersión
� ¿Son los datos muy concentrados? ¿muydispersos?
●Rango (variables numéricas)●Desviación típica (variables numéricas)●Rango intercuartil (variables numéricas e
ordinales)● Indice de variación cualitativa(variables
categóricas)
0
2.5
5
7.5
10
12.5
15
17.5
20
22.5
Cou
nt
100 150 200 250 300 350 400 450 500 550 600 650Durée des pauses (ms)
Histogram0
2
4
6
8
10
12
Cou
nt
100 150 200 250 300 350 400 450 500 550 600 650Durée des pauses (ms)
Histogram
Mesures de tendance centrale et de dispersion
Media = 368 ms
Desviación típica = 102 ms
Rango = 426 ms
Media = 368 ms
Desviación típica = 53 ms
Rango = 216 ms
Inferencia estadística(prueba de hipótesis)
Prueba de hipótesis - Definición
● Objetivo
Determinar, con cierta probabilidad , si las diferencias observadas se deben a la casualidad o no.
Población y muestra
● Ejemplo: Los Españoles hablan másrapidamente que 300 sílabas por minuto?
● Medir la velocidad de TODOS los Españoleses casi imposible � subconjunto de Españoles
● Todos los Españole = población● Subconjunto de Españoles = muestra
Población y muestra
Muestreo
Población Muestra
Parámetros estimados
Dodge, 2006
Prueba de hipótesis - Definición
Ejemplo:Dos grupos de estudiantes hicieron una prueba de alemán. El primer grupo obtuvo un media de 15.75 y el segundo una media de 17.
� ¿Es el segundo grupo realmente mejor que el primer grupo o la diferencia entre los dos grupos se debe a la casualidad?
Prueba de hipótesis - Definición
10
11
12
13
14
15
16
17
18
19
20
Grupo A Grupo B
Grupo
Not
a
15.75
17.00
Prueba de hipótesis - Definición
x
x
x
x
xx
xx
xx
x
x
oo
o
oo
o
o
oo
o
o
o
Grupo A: Media = 15.75
Grupo B: Media = 17.00
Prueba de hipótesis - Definición
x
x
x
x
xx
xx
xx
x
x
oo
o
oo
o
o
oo
o
o
o
Grupo A: Media = 15.75
Grupo B: Media = 17.00
UNA POBLACION, DIFERENCIA DEBIDA A LA CASUALIDAD
La diferencia no es significativa
Prueba de hipótesis - Definición
x
x
x
x
xx
xx
xx
x
x
oo
o
oo
o
o
oo
o
o
o
Grupo A: Media = 15.75
Grupo B: Media = 17.00
DOS POBLACIONES DIFERENTES
La diferencia es significativa
Prueba de hipótesis - Definición
● Ejemplo: Test-t (compara las medias de dos grupos)
10
11
12
13
14
15
16
17
18
19
20
Grupo A Grupo B
Grupo
Not
a
15.75
17.00Diferencia significativa
El grupo B es mejor que el grupo A.
=> Dos poblaciones
Diferencia S
Prueba de hipótesis - Selección de la prueba
Prueba de hipótesis - Decisión
● El programa estadístico proporciona un valor pque permite decidir si la diferencia se debe a la casualidad o no.● Si p < .05 � diferencia significativa � la
diferencia no se debe a la casualidad● Si p > .05 � no diferencia significativa � la
diferencia se debe a la casualidad
-1.250 22 -2.112 .0463
Mean Diff. DF t-Value P-Value
A, B
Unpaired t-test for NoteGrouping Variable: GroupeHypothesized Difference = 0
Prueba de hipótesis - Ejemplo
¿Los francófonos avanzados en españolperciben más rápidamente o más lentamente el acento que los francófonos sin conocimientos del español?
Two Sample t-testt = -6.8456, df = 466, p-value = 2.411e-11Means Advanced NoKnowledge
1380.64 1686.70
Prueba de hipótesis - Ejemplo
Treinta participantes tuvieron que identificar unas secuencias (ej. great eyes, grey ties) producidas a una velocidad lenta y a una velocidad rápida. Los investigadores examinaron el efecto de la velocidad de elocución en la identificación de las secuencias mediante un análisis de varianza (F).
La media para la identificación de las secuencias rápidas era de 86.2% y era de 89.9% para las secuencias lentas. He aquí los resultados estadísticos en cuanto al efecto de velocidad de elocución: F(1, 29) = 21.86, p < 0.001.
Pregunta: ¿Cuál es la interpretación de los resultados?
Análisis de un experimento en R
Impacto de la L1 en la percepciónde la velocidad de elocución
Objetivo
● Determinar si la percepción de la velocidad de elocución depende de la lengua materna (francés o español)
Método
● Participantes● 28 oyentes de lengua materna española ("ES")
● 40 oyentes de lengua materna francesa ("FR")
● Material● 48 frases españolas
Método
Método
● Análisis de los datos● PercVelocidad = valor numérico entre 0 y 9
� Media por participante
● Variable dependiente?● Variable independiente?● Prueba?
R: Primer vistazo
Ej1.txt
Impacto del grado de acentoregional en la percepción de la velocidad de elocución en L1
Objetivo
● Determinar si existe una relación en losnativos entre la percepción de la velocidad de elocución y el grado de acento regional
Método
● Participantes● 40 oyentes de lengua materna española
● Material● Frases españolas producidas por locutores
españoles y costarricenses
Método
Método
● Análisis de los datos● PercVelocidad = valor numérico entre 0 y 9
� Media por frase● PercAcento = valor numérico entre 1 y 7
� Media por frase
● Variable dependiente?
● Variable independiente?● Prueba?
REj2.txt
Ejercicio
Estudio de la velocidad de articulación en los hombres y en
las mujeres
Objetivo
● Determinar si la velocidad de articulación es diferente en los hombres y en las mujeres
Método
● Participantes● 17 locutoras de lengua materna española
("Mujer")
● 17 locutores de lengua materna española("Hombre")
● Material● 20 frases españolas
Método
● Análisis de los datos●Medición de la duración silábica media para
cada frase y cada locutor● Duración silábica larga = velocidad de articulación lenta● Duración silábica corta = velocidad de articulación rápida
� Media por locutor
● Variable dependiente?● Variable independiente?● Prueba?
Ejercicio.txt
Unas referencias…
● Baayen, H. (2008). Analysing linguistic data. A practical introduction to statistics using R. Cambridge: Cambridge University Press.http://www.sfs.uni-tuebingen.de/~hbaayen/publications/baayenCUPstats.pdf
● Dalgaard, P. (2008). Introductory statistics with R (2nd ed.). New-York: Springer. http://www.academia.dk/BiologiskAntropologi/Epidemiologi/PDF/Introductory_Statistics_with_R__2nd_ed.pdf
● Dodge, Y. (2006). Premiers pas en statistique (2ème éd.). Paris: Springer.
● Grosjean, F. & Dommergues, J.-Y. (2011). La statistique en clair. Paris: Ellipses.
● Howell, D. (2013). Statistical Methods in Psychology (8th ed). Wadsworth: Cengage Learning
● Johnson, K. (2008). Quantitative methods in linguistics. Malden, MA: Blackwell Publishing.
● Witte, R.S. & Witte J.S. (2000). Statistics (6th ed.). Fort Worth [etc.] : Harcourt College Publ.