23
André Jalles Departamento de Estatística e Matemática Aplicada

Medidas de Posição e de Variabilidade

Embed Size (px)

DESCRIPTION

Matematica Estatistica

Citation preview

Page 1: Medidas de Posição e de Variabilidade

André Jalles

Departamento de Estatística e Matemática Aplicada

Page 2: Medidas de Posição e de Variabilidade

Sumarização de dadosMedidas Proporção: medida que proporciona a comparação entre

distribuições de frequência com tamanhos amostraisdiferentes.

Pessoas de 18 a 24 anos de idade, por nível de instrução,segundo a situação do domicílio e gênero, Estado do ceará 2010

Nível de instrução Urbana Rural

Homens Percentual Mulheres Percentual Homens Percentual Mulheres Percentual

Sem instrução e fundamental incompleto 118.425 28,0% 89.497 20,2% 63.520 45,1% 41.168 32,4%

Fundamental completo e médio incompleto 119.796 28,3% 118.500 26,7% 45.235 32,1% 41.829 32,9%

Médio completo e superior incompleto 176.907 41,8% 221.604 50,0% 31.550 22,4% 43.070 33,9%

Superior completo 7.744 1,8% 13.780 3,1% 421 0,3% 1.035 0,8%

Total 422.872 100% 443.381 100% 140.726 100% 127.102 100%

Fonte: SIDRA/IBGE, Censo 2010

Page 3: Medidas de Posição e de Variabilidade

Sumarização de dadosMedidas Razão: medida que proporciona a comparação de algum fenômeno

entre categorias distintas.

Pessoas de 18 anos ou mais de idade que costumam consumir bebidaalcoólica uma vez ou mais por mês, por gênero e UF-NE, ano 2013.

UF Masculino Feminino total Razão

Alagoas 354 122 476 2,90

Bahia 2.247 1.004 3251 2,24

Ceará 1.062 306 1368 3,47

Maranhão 750 258 1008 2,91

Paraíba 357 127 484 2,81

Pernambuco 1.145 444 1589 2,58

Piauí 431 154 585 2,80

Rio Grande do Norte 435 129 564 3,37

Sergipe 309 98 407 3,15

Fonte: SIDRA/IBGE

Page 4: Medidas de Posição e de Variabilidade

Sumarização de dadosMedidasVariável quantitativa

{x1,x2,x3,...,xn}, Amostra com nobservações de uma variávelquantitativa.

Page 5: Medidas de Posição e de Variabilidade

Medidas de posição (localização)

Média aritmética: localiza o “centro degravidade” dos dados

Fórmula: (x1+x2+x3+...+xn)/n

Exemplo: (1+2+3+5+9)/5 = 4

Deficiência: sensível a valoresextremos.

Page 6: Medidas de Posição e de Variabilidade

Medidas de posição (localização)

Média Geométrica: localiza o “centro”

de dados geométricos.

Fórmula: (x1×x2×x3×... ×xn)1/n

Exemplo: (2×4x8x32x512)1/5

= 16

Deve ser utilizada para dados

geométricos (Exemplo: inflação)

Page 7: Medidas de Posição e de Variabilidade

Medidas de posição (localização)Mediana: localiza o valor que divide osdados em dois grupos de tamanhos“iguais”.

Exemplo: {1,2,3,5,9}, Mediana = 3

Fórmula:

n ímpar: x(n+1)/2

n par: (xn/2+xn/2+1)/2Geral: x(n+1)/2

Page 8: Medidas de Posição e de Variabilidade

Medidas de posição: Quartis

Q1- primeiro quartil: divide os dadosem duas partes, uma com 25% e outracom 75% das observações.

Q2- segundo quartil: Mediana

Q3- terceiro quartil: divide os dados emduas partes, uma com 75% e outra com25% das observações.

Page 9: Medidas de Posição e de Variabilidade

Medidas de posição: QuartisExemplo: {1,2,3,5,9}

Q1=2

Q3=5

Page 10: Medidas de Posição e de Variabilidade

Medidas de posição (localização)Moda: valor mais frequente. Valor quemais se repete. Valor que representa olocal de maior densidade dos dados,cuja vizinhança é mais “povoada” comdados.

Exemplo: {1,2,3,5,9}, Moda = 2

Page 11: Medidas de Posição e de Variabilidade

Medidas de posição (localização)Exemplo: {1,2,3,5,9}

0 1 2 3 4 5 6 7 8 9

Moda Média

Mediana

Page 12: Medidas de Posição e de Variabilidade

Variável quantitativa {x1,x2,x3,...,xn}, Amostra com n observações de uma variávelquantitativa.

Uma medida do centro isolada não é adequada para descreverdados numericamente para uma variável quantitativa. Eladescreve um valor típico, mas não a dispersão dos dados em tornodo valor típico. (Agreste,A e Finlay,B. Métodos Est. Para as C. Sociais)

A dispersão de conjunto de dados é a variabilidade que os dadosapresentam entre si. Se todos os valores forem iguais, não hádispersão; se os dados não são iguais, existe dispersão entre osdados. A dispersão é pequena quando os valores são próximos unsdos outros. Se os valores são muito diferentes entre si, a dispersãoé grande, assim, as medidas de dispersão apresentam o grau deagregação dos dados. (Waldir Medri, ANÁLISE EXPLORATÓRIA DE DADOS )

Page 13: Medidas de Posição e de Variabilidade

Medidas de dispersão (variabilidade)

Medida possível de variabilidade dos

dados

Amplitude dos dados: Máximo - Mínimo

Exemplo: {1,2,3,5,9}

9 – 1 = 8

Page 14: Medidas de Posição e de Variabilidade

Medidas de dispersão (variabilidade)

Medida possível de variabilidade dos

dados

Distância interquartílica: Q3 – Q1

Exemplo: {1,2,3,5,9}

5 – 2 = 3

Page 15: Medidas de Posição e de Variabilidade

Medidas de dispersão (variabilidade)

Média aritmética: localiza o “centro de

gravidade” dos dados. Qual é a sua

representatividade?

Medida possível do “custo”: Distância

quadrática média dos dados à média

Variância: Fórmula (m=média aritmética)

((x1-m)2+(x2-m)

2+...+(xn-m)

2)/(n-1)

Exemplo

((1-4)2+(2-4)

2+(3-4)

2+(5-4)

2+(9-4)

2)/4 = 10

Page 16: Medidas de Posição e de Variabilidade

Menor soma quadrática

n

xn

x

n

x

mm

n

xnxxm

mfa

acbbx

xfcbxaxxf

nmxmxmxmf

i

ii

iii

iii

2

2

2

2

2

2

''

2

442'

:se ,0)'( modo, desse ,2

4'

:se 0,)'( .)(

2)(

21

22

2

2

222

Page 17: Medidas de Posição e de Variabilidade

Medidas de dispersão (variabilidade)

Problemas da variância: unidade de

medida quadrática

Desvio-Padrão: raiz da Variância

Exemplo

raiz((1-4)2+(2-4)

2+(3-4)

2+(5-4)

2+(9-4)

2)/4

= raiz(10) 3,16

Page 18: Medidas de Posição e de Variabilidade

O que o Desvio Padrão representa

Page 19: Medidas de Posição e de Variabilidade

Medidas de dispersão (variabilidade)

Mediana: localiza o valor que divide os

dados em dois grupos de tamanhos

“iguais”.

Desvio Médio: Distância linear média

entre as observações e a mediana

Exemplo

(|1-3|+|2-3|+|3-3|+|5-3|+|9-3|)/5=11/5=2,2

Page 20: Medidas de Posição e de Variabilidade

Mínima soma linear

Page 21: Medidas de Posição e de Variabilidade

Medidas de dispersão (variabilidade)

Problemas do desvio-padrão: a

unidade de medida influencia o valor

Coeficiente de variação: S/média

Adimensional

Exemplo: 3,16/ 4 0,7906

Page 22: Medidas de Posição e de Variabilidade

Medidas de assimetria

Medida de afastamento da simetria dos

dados, ou grau de deformação da

distribuição dos dados

Comparação entre medidas de tendência

central

Coeficiente de Pearson:

Sk = 3(média-mediana)/S

= 3(4-3)/3,16 0,9487

Page 23: Medidas de Posição e de Variabilidade

Medidas de assimetria

Medida de afastamento da simetria dos

dados, ou grau de deformação da

distribuição dos dados

Comparação entre medidas de tendência

central

Coeficiente quartil de assimetria

eQ = ((Q3-Q2)-(Q2-Q1))/(Q3-Q1)

=((5-3)-(3-2))/(5-2) 0,3333