Upload
dzf6dv
View
2
Download
0
Embed Size (px)
Citation preview
12-03-2014
1
Estatística Descritiva
Bivariada
Instituto Superior de Gestão e Administração - Santarém Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014
Estatística Descritiva Bivariada
A Estatística Bivariada considera o estudo simultâneo de duas variáveis
estatísticas.
Cada indivíduo (objeto) é avaliado segundo duas modalidades, uma
pertencendo à primeira variável e a outra à segunda variável, isto é,
Indivíduo Variável X Variável Y
1 X1 Y1
2 X2 Y2
... ... ...
n Xn Yn
Instituto Superior de Gestão e Administração - Santarém - 130 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014
12-03-2014
2
Cruzamento de variáveis
Tabelas de Contingência
O resumo de dados bivariados depende do nível de mensuração das variáveis.
Os dados bivariados podem ser representados através de tabelas de dupla
entrada designadas por tabelas de contingência.
X\Y Y1 Y2 ... Yj total
X1 O11 O12 ... O1j L1
X2 O21 O22 ... O2j L2
... ... ... ... ... ...
Xi Oi1 Oi2 ... Oij Li
total C1 C2 ... Cj n
Distribuição
marginal de X
Distribuição
marginal de Y
Instituto Superior de Gestão e Administração - Santarém - 131 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014
Tabelas de Contingência - Exemplo
Considere o seguinte conjunto de dados:
NOTA: Estes dados encontram-se no ficheiro de dados do SPSS com o nome
3_educacao.sav
Instituto Superior de Gestão e Administração - Santarém - 132 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014
12-03-2014
3
Tabelas de Contingência - Exemplo
No SPSS as tabelas de contingência podem ser obtidas através dos comandos:
Instituto Superior de Gestão e Administração - Santarém - 133 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014
Tabelas de Contingência - Exemplo
Instituto Superior de Gestão e Administração - Santarém - 134 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014
12-03-2014
4
Associação Estatística
A “associação estatística” entre duas variáveis pode ser estudada
considerando:
• a forma de ligação de duas variáveis
linear/não linear,
• a sua intensidade
forte, média ou fraca
• o seu sentido
positivo ou negativo
Instituto Superior de Gestão e Administração - Santarém - 135 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014
Associação Estatística
A “associação estatística” diz-se
• positiva
se as variáveis variam no mesmo sentido, isto é, se para valores
elevados de uma variável se observam valores elevados da outra e,
simultaneamente, para valores reduzidos das duas variáveis é
verificada a mesma associação.
• negativa
se as variáveis variarem em sentidos opostos, isto é, a valores elevados
de uma variável estão associados valores baixos da outra variável e
vice-versa.
Instituto Superior de Gestão e Administração - Santarém - 136 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014
12-03-2014
5
Associação Estatística
Diagramas de Dispersão
Associação linear positiva forte Associação linear positiva fraca
50
51
52
53
54
55
56
57
58
7 9 11 13 15 17 19 21
50
51
52
53
54
55
56
57
58
7 9 11 13 15 17 19 21
Associação linear negativa forte Associação linear negativa fraca
50
52
54
56
58
60
7 9 11 13 15 17 19 21
50
51
52
53
54
55
56
57
58
7 9 11 13 15 17 19 21
A existência (ou não) de associação estatística entre duas variáveis pode
ser analisada graficamente através de diagramas de dispersão:
Instituto Superior de Gestão e Administração - Santarém - 137 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014
Associação Estatística
Diagramas de Dispersão
Não existe qualquer tipo de
associação entre as variáveis
51
52
53
54
55
56
57
58
7 9 11 13 15 1750
52
54
56
58
60
7 9 11 13 15 17 19 21
Existe associação entre as
variáveis mas não do tipo linear
Existe associação entre as
variáveis mas não do tipo linear
Existe associação entre as
variáveis mas não do tipo linear
47
49
51
53
55
57
59
61
7 9 11 13 15 17 19 21 23
48
50
52
54
56
58
0 5 10 15 20 25
Instituto Superior de Gestão e Administração - Santarém - 138 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014
12-03-2014
6
Diagramas de Dispersão - Exemplo
No SPSS, os diagramas de dispersão podem ser obtidos através dos comandos:
Instituto Superior de Gestão e Administração - Santarém - 139 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014
Diagramas de Dispersão - Exemplo
Instituto Superior de Gestão e Administração - Santarém - 140 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014
12-03-2014
7
Medidas de Associação Estatística
O grau de relação linear entre duas variáveis quantitativas pode ser
estudado através da covariância
A covariância entre as variáveis “Compreensão Leitora” (X) e “Rendimento
Escolar” (Y), é dada por
n
i i ni 1
xy i ii 1
(x x)(y y)1
Cov(X,Y) S ' X Y nX Yn 1 n 1
xy
36728 30 11.167 108.567Cov(X,Y) S ' 12.309
29
Instituto Superior de Gestão e Administração - Santarém - 141 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014
Medidas de Associação Estatística
Esta medida de associação é, por vezes “difícil” de interpretar uma vez
que a covariância depende das unidades em que as variáveis são
medidas.
Apenas permite verificar o sinal da associação (positivo, negativo), mas
não permite quantificar a intensidade (forte, média ou fraca) dessa
associação.
Para ultrapassar essa dificuldade é usual recorrer medidas
estardardizadas, designadas por coeficientes de correlação:
• Pearson - Caso de variáveis quantitativas
• Spearman - Caso de variáveis pelo menos ordinais
• Phi - Caso de variáveis dicotómicas
Instituto Superior de Gestão e Administração - Santarém - 142 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014
12-03-2014
8
Coeficiente de Correlação Pearson
O coeficiente de correlação de Pearson
• mede o grau de associação linear entre duas variáveis estatísticas
• não depende das unidades de medida das variáveis
• os seus valores variam sempre entre –1 e 1
O sinal do coeficiente de correlação de Pearson indica a direcção da
associação linear:
• se o sinal for positivo, existe uma tendência para as duas variáveis
variarem no mesmo sentido;
• se o sinal for negativo, existe uma tendência para as duas variáveis
variarem em sentido contrário
Instituto Superior de Gestão e Administração - Santarém - 143 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014
Coeficiente de Correlação Pearson
De uma forma geral, pode-se considerar que:
• Se rXY = 1 ou rXY = -1 existe correlação linear perfeita
• Se rXY = 0, não existe qualquer tipo de correlação linear entre as duas
variáveis em estudo.
(embora possa existir correlação de outro tipo que não o linear)
• Se 0 < | rXY | < 0.3, existe correlação linear baixa
• Se 0.3 | rXY | < 0.7, existe correlação linear média
• Se 0.7 | rXY | < 1, existe correlação linear forte
Instituto Superior de Gestão e Administração - Santarém - 144 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014
12-03-2014
9
Coeficiente de Correlação de Pearson
Coeficiente de Correlação de Pearson pode ser determinado através da
expressão
O Coeficiente de correlação de Pearson entre as variáveis “Compreensão
Leitora” (X) e “Rendimento Escolar” (Y), é dado por
o que permite concluir que a associação linear entre essas variáveis é positiva
média.
n n
i i i ixy i 1 i 1
xyn n n n
x y 2 2 2 2 2 2
i i i ii 1 i 1 i 1 i 1
(X X)(Y Y) X Y nX YS '
rS ' S '
(X X) (Y Y) X nX Y nY
xy2 2
36728 30 11.167 108.567r 0.679
4383 30 11.167 354035 30 108.567
Instituto Superior de Gestão e Administração - Santarém - 145 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014
Coeficiente de Correlação Pearson - SPSS
O Coeficiente de Correlação de Pearson pode ser obtido no SPSS através dos
comandos:
Instituto Superior de Gestão e Administração - Santarém - 146 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014
12-03-2014
10
Coeficiente de Correlação Pearson - SPSS
Instituto Superior de Gestão e Administração - Santarém - 147 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014
Coeficiente Correlação de Spearman - SPSS
Coeficiente de Correlação de Spearman é aplicado quando as variáveis estão
definidas numa escala pelo menos ordinal e apresenta as mesmas
propriedades que o coeficiente de correlação de Pearson
Este coeficiente é obtido no SPSS seguindo os mesmos comandos usados para o
coeficiente de Pearson, mas agora escolhendo a opção:
Instituto Superior de Gestão e Administração - Santarém - 148 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014
12-03-2014
11
Exercícios
Considere o seguinte ficheiro de dados SPSS (1_classificação_teste) criado nas
páginas 45 a 74, referente à avaliação contínua de 27 estudantes a uma cadeira
de estatística:
Instituto Superior de Gestão e Administração - Santarém - 149 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014
Exercícios
a). Estude a relação estatística existente entre a média nos testes escritos e a
classificação obtida na participação.
b). Estude a associação estatística existente entre a classificação no 1º teste
escrito e a nota final à cadeira. Comente os resultados obtidos.
c). Estude a associação estatística existente entre o ano do curso e a
classificação final à cadeira. Comente os resultados obtidos.
Instituto Superior de Gestão e Administração - Santarém - 150 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014