11
12-03-2014 1 Estatística Descritiva Bivariada Instituto Superior de Gestão e Administração - Santarém Análise e Tratamento de Dados GRH 1º Ano 2º Semestre Ano Lectivo 2013/2014 Estatística Descritiva Bivariada A Estatística Bivariada considera o estudo simultâneo de duas variáveis estatísticas. Cada indivíduo (objeto) é avaliado segundo duas modalidades, uma pertencendo à primeira variável e a outra à segunda variável, isto é, Indivíduo Variável X Variável Y 1 X 1 Y 1 2 X 2 Y 2 ... ... ... n X n Y n Instituto Superior de Gestão e Administração - Santarém - 130 - Análise e Tratamento de Dados GRH 1º Ano 2º Semestre Ano Lectivo 2013/2014

3 ATD Estatistica Bivariada

  • Upload
    dzf6dv

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 3 ATD Estatistica Bivariada

12-03-2014

1

Estatística Descritiva

Bivariada

Instituto Superior de Gestão e Administração - Santarém Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014

Estatística Descritiva Bivariada

A Estatística Bivariada considera o estudo simultâneo de duas variáveis

estatísticas.

Cada indivíduo (objeto) é avaliado segundo duas modalidades, uma

pertencendo à primeira variável e a outra à segunda variável, isto é,

Indivíduo Variável X Variável Y

1 X1 Y1

2 X2 Y2

... ... ...

n Xn Yn

Instituto Superior de Gestão e Administração - Santarém - 130 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014

Page 2: 3 ATD Estatistica Bivariada

12-03-2014

2

Cruzamento de variáveis

Tabelas de Contingência

O resumo de dados bivariados depende do nível de mensuração das variáveis.

Os dados bivariados podem ser representados através de tabelas de dupla

entrada designadas por tabelas de contingência.

X\Y Y1 Y2 ... Yj total

X1 O11 O12 ... O1j L1

X2 O21 O22 ... O2j L2

... ... ... ... ... ...

Xi Oi1 Oi2 ... Oij Li

total C1 C2 ... Cj n

Distribuição

marginal de X

Distribuição

marginal de Y

Instituto Superior de Gestão e Administração - Santarém - 131 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014

Tabelas de Contingência - Exemplo

Considere o seguinte conjunto de dados:

NOTA: Estes dados encontram-se no ficheiro de dados do SPSS com o nome

3_educacao.sav

Instituto Superior de Gestão e Administração - Santarém - 132 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014

Page 3: 3 ATD Estatistica Bivariada

12-03-2014

3

Tabelas de Contingência - Exemplo

No SPSS as tabelas de contingência podem ser obtidas através dos comandos:

Instituto Superior de Gestão e Administração - Santarém - 133 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014

Tabelas de Contingência - Exemplo

Instituto Superior de Gestão e Administração - Santarém - 134 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014

Page 4: 3 ATD Estatistica Bivariada

12-03-2014

4

Associação Estatística

A “associação estatística” entre duas variáveis pode ser estudada

considerando:

• a forma de ligação de duas variáveis

linear/não linear,

• a sua intensidade

forte, média ou fraca

• o seu sentido

positivo ou negativo

Instituto Superior de Gestão e Administração - Santarém - 135 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014

Associação Estatística

A “associação estatística” diz-se

• positiva

se as variáveis variam no mesmo sentido, isto é, se para valores

elevados de uma variável se observam valores elevados da outra e,

simultaneamente, para valores reduzidos das duas variáveis é

verificada a mesma associação.

• negativa

se as variáveis variarem em sentidos opostos, isto é, a valores elevados

de uma variável estão associados valores baixos da outra variável e

vice-versa.

Instituto Superior de Gestão e Administração - Santarém - 136 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014

Page 5: 3 ATD Estatistica Bivariada

12-03-2014

5

Associação Estatística

Diagramas de Dispersão

Associação linear positiva forte Associação linear positiva fraca

50

51

52

53

54

55

56

57

58

7 9 11 13 15 17 19 21

50

51

52

53

54

55

56

57

58

7 9 11 13 15 17 19 21

Associação linear negativa forte Associação linear negativa fraca

50

52

54

56

58

60

7 9 11 13 15 17 19 21

50

51

52

53

54

55

56

57

58

7 9 11 13 15 17 19 21

A existência (ou não) de associação estatística entre duas variáveis pode

ser analisada graficamente através de diagramas de dispersão:

Instituto Superior de Gestão e Administração - Santarém - 137 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014

Associação Estatística

Diagramas de Dispersão

Não existe qualquer tipo de

associação entre as variáveis

51

52

53

54

55

56

57

58

7 9 11 13 15 1750

52

54

56

58

60

7 9 11 13 15 17 19 21

Existe associação entre as

variáveis mas não do tipo linear

Existe associação entre as

variáveis mas não do tipo linear

Existe associação entre as

variáveis mas não do tipo linear

47

49

51

53

55

57

59

61

7 9 11 13 15 17 19 21 23

48

50

52

54

56

58

0 5 10 15 20 25

Instituto Superior de Gestão e Administração - Santarém - 138 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014

Page 6: 3 ATD Estatistica Bivariada

12-03-2014

6

Diagramas de Dispersão - Exemplo

No SPSS, os diagramas de dispersão podem ser obtidos através dos comandos:

Instituto Superior de Gestão e Administração - Santarém - 139 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014

Diagramas de Dispersão - Exemplo

Instituto Superior de Gestão e Administração - Santarém - 140 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014

Page 7: 3 ATD Estatistica Bivariada

12-03-2014

7

Medidas de Associação Estatística

O grau de relação linear entre duas variáveis quantitativas pode ser

estudado através da covariância

A covariância entre as variáveis “Compreensão Leitora” (X) e “Rendimento

Escolar” (Y), é dada por

n

i i ni 1

xy i ii 1

(x x)(y y)1

Cov(X,Y) S ' X Y nX Yn 1 n 1

xy

36728 30 11.167 108.567Cov(X,Y) S ' 12.309

29

Instituto Superior de Gestão e Administração - Santarém - 141 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014

Medidas de Associação Estatística

Esta medida de associação é, por vezes “difícil” de interpretar uma vez

que a covariância depende das unidades em que as variáveis são

medidas.

Apenas permite verificar o sinal da associação (positivo, negativo), mas

não permite quantificar a intensidade (forte, média ou fraca) dessa

associação.

Para ultrapassar essa dificuldade é usual recorrer medidas

estardardizadas, designadas por coeficientes de correlação:

• Pearson - Caso de variáveis quantitativas

• Spearman - Caso de variáveis pelo menos ordinais

• Phi - Caso de variáveis dicotómicas

Instituto Superior de Gestão e Administração - Santarém - 142 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014

Page 8: 3 ATD Estatistica Bivariada

12-03-2014

8

Coeficiente de Correlação Pearson

O coeficiente de correlação de Pearson

• mede o grau de associação linear entre duas variáveis estatísticas

• não depende das unidades de medida das variáveis

• os seus valores variam sempre entre –1 e 1

O sinal do coeficiente de correlação de Pearson indica a direcção da

associação linear:

• se o sinal for positivo, existe uma tendência para as duas variáveis

variarem no mesmo sentido;

• se o sinal for negativo, existe uma tendência para as duas variáveis

variarem em sentido contrário

Instituto Superior de Gestão e Administração - Santarém - 143 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014

Coeficiente de Correlação Pearson

De uma forma geral, pode-se considerar que:

• Se rXY = 1 ou rXY = -1 existe correlação linear perfeita

• Se rXY = 0, não existe qualquer tipo de correlação linear entre as duas

variáveis em estudo.

(embora possa existir correlação de outro tipo que não o linear)

• Se 0 < | rXY | < 0.3, existe correlação linear baixa

• Se 0.3 | rXY | < 0.7, existe correlação linear média

• Se 0.7 | rXY | < 1, existe correlação linear forte

Instituto Superior de Gestão e Administração - Santarém - 144 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014

Page 9: 3 ATD Estatistica Bivariada

12-03-2014

9

Coeficiente de Correlação de Pearson

Coeficiente de Correlação de Pearson pode ser determinado através da

expressão

O Coeficiente de correlação de Pearson entre as variáveis “Compreensão

Leitora” (X) e “Rendimento Escolar” (Y), é dado por

o que permite concluir que a associação linear entre essas variáveis é positiva

média.

n n

i i i ixy i 1 i 1

xyn n n n

x y 2 2 2 2 2 2

i i i ii 1 i 1 i 1 i 1

(X X)(Y Y) X Y nX YS '

rS ' S '

(X X) (Y Y) X nX Y nY

xy2 2

36728 30 11.167 108.567r 0.679

4383 30 11.167 354035 30 108.567

Instituto Superior de Gestão e Administração - Santarém - 145 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014

Coeficiente de Correlação Pearson - SPSS

O Coeficiente de Correlação de Pearson pode ser obtido no SPSS através dos

comandos:

Instituto Superior de Gestão e Administração - Santarém - 146 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014

Page 10: 3 ATD Estatistica Bivariada

12-03-2014

10

Coeficiente de Correlação Pearson - SPSS

Instituto Superior de Gestão e Administração - Santarém - 147 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014

Coeficiente Correlação de Spearman - SPSS

Coeficiente de Correlação de Spearman é aplicado quando as variáveis estão

definidas numa escala pelo menos ordinal e apresenta as mesmas

propriedades que o coeficiente de correlação de Pearson

Este coeficiente é obtido no SPSS seguindo os mesmos comandos usados para o

coeficiente de Pearson, mas agora escolhendo a opção:

Instituto Superior de Gestão e Administração - Santarém - 148 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014

Page 11: 3 ATD Estatistica Bivariada

12-03-2014

11

Exercícios

Considere o seguinte ficheiro de dados SPSS (1_classificação_teste) criado nas

páginas 45 a 74, referente à avaliação contínua de 27 estudantes a uma cadeira

de estatística:

Instituto Superior de Gestão e Administração - Santarém - 149 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014

Exercícios

a). Estude a relação estatística existente entre a média nos testes escritos e a

classificação obtida na participação.

b). Estude a associação estatística existente entre a classificação no 1º teste

escrito e a nota final à cadeira. Comente os resultados obtidos.

c). Estude a associação estatística existente entre o ano do curso e a

classificação final à cadeira. Comente os resultados obtidos.

Instituto Superior de Gestão e Administração - Santarém - 150 - Análise e Tratamento de Dados ● GRH ● 1º Ano ● 2º Semestre ● Ano Lectivo 2013/2014