Upload
internet
View
111
Download
0
Embed Size (px)
Citation preview
Nevembro/2004 FEG & FOSJC1
Estatística Básica Utilizando o Excel
Fernando Augusto Silva Marins
3a. Aula - Estatística Descritiva(medidas de posição e dispersão)
Nevembro/2004 FEG & FOSJC2
Tópicos
Medidas de Tendência Central Média, Mediana, Moda
Quartis
Medidas de Dispersão Amplitude, Variância e Desvio-Padrão e
coeficiente de Variação
Nevembro/2004 FEG & FOSJC3
Tópicos
Formato Simétrica, assimétrica (Gráfico Box-and-whisker)
Coeficiente de Correlação
(continuação)
Nevembro/2004 FEG & FOSJC4
Sumário das Medidas
Tendência Central
MédiaMediana
Moda
Quartis
Sumário das Medidas
Variação
Variância
Desvio-Padrão
Coeficiente de Variação
Amplitude
Nevembro/2004 FEG & FOSJC5
Medidas de Tendência Central
Tendência Central
Média Mediana Moda
1
1
n
ii
N
ii
XX
n
X
N
Nevembro/2004 FEG & FOSJC6
Média Média
Amostra
População
1 1 2
n
ii n
XX X X
Xn n
1 1 2
N
ii N
XX X X
N N
Tamanho da Amostra
Tamanho da População
Nevembro/2004 FEG & FOSJC7
Média
Medida mais comum de tendência central
Afetada por valores extremos (outliers)
(continuação)
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14
Média = 5 Média = 6
Nevembro/2004 FEG & FOSJC8
Mediana Medida Robusta de Tendência Central Não é afetada por valores extremos
Numa disposição ordenada, a mediana é o valor do “meio” se n, or N, é ímpar, a mediana é o número do
meio da seqüência If n, or N, é par, a mediana é a média dos dois
números centrais
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14
Mediana = 5 Mediana = 5
Nevembro/2004 FEG & FOSJC9
Moda Valor que ocorre mais freqüentemente
Não é afetada por valores extremos
Pode não haver Moda num conjunto de dados
Pode haver várias Modas num conjunto de dados
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Moda = 9
0 1 2 3 4 5 6
Não há Moda
Nevembro/2004 FEG & FOSJC10
QuartisDividem os Dados já ordenados em 4 partes
Posição i-th Quartil:
e são medidas de localização não-centrais
= Mediana é medida de tendência central
25% 25% 25% 25%
1Q 2Q 3Q
Dados ordenados: 11 12 13 16 16 17 18 21 22
1Q 3Q
2Q
1
4i
i nQ
Nevembro/2004 FEG & FOSJC11
Medidas de Variação
Variação
Variância Desvio Padrão Coeficiente de Variação
Variância
População
Variância Amostra
Desvio Padrão População
Desvio Padrão
Amostra
Amplitude
Nevembro/2004 FEG & FOSJC12
Amplitude (Range)
Medida de variação Diferença entre o maior e o menor valor
das observações:
Ignora o tipo da distribuição dos dados
7 8 9 10 11 12
Range = 12 - 7 = 5
7 8 9 10 11 12
Range = 12 - 7 = 5
menormaior XXRange
Nevembro/2004 FEG & FOSJC13
2
2 1
N
ii
X
N
Importante medida de variação Mostra variação média em torno da Média
Variância Amostral:
Variância Populacional:
2
2 1
1
n
ii
X XS
n
Variância
Nevembro/2004 FEG & FOSJC14
Desvio Padrão Importante medida de variação Mostra variação média em torno da Média Está na mesma unidade dos dados
originais
Desvio padrão amostral:
Desvio padrão populacional:
2
1
1
n
ii
X XS
n
2
1
N
ii
X
N
Nevembro/2004 FEG & FOSJC15
Comparação de Desvios Padrão
Média = 15,5 s = 3,338 11 12 13 14 15 16 17 18 19 20 21
11 12 13 14 15 16 17 18 19 20 21
Dados B
Dados A
Média = 15,5 s = 0,9258
11 12 13 14 15 16 17 18 19 20 21
Média = 15,5 s = 4,57
Dados C
Nevembro/2004 FEG & FOSJC16
Coeficiente de Variação
Mede variação relativa em relação à Média
Sempre em percentages (%) Usado na comparação de 2 ou mais
conjuntos de dados expressos em diferentes unidades de medidas
100%S
CVX
Nevembro/2004 FEG & FOSJC17
Comparação com Coeficientes de Variação
Ação A: Preço médio último ano = $50, Desvio padrão =
$5 Ação B:
Preço médio último ano = $100, Desvio padrão = $5
Coeficientes de variação:
Ação A:
Ação B:
$5100% 100% 10%
$50
SCV
X
$5100% 100% 5%
$100
SCV
X
Nevembro/2004 FEG & FOSJC18
Formato de uma Distribuição
Descreve como os Dados estão distribuídos
Medidas de formato Simétrica ou Assimétrica
Média = Mediana =Moda Média < Mediana < Moda Moda < Mediana < Média
Assimétrica à direitaAssimétrica à esquerda Simétrica
Nevembro/2004 FEG & FOSJC19
Análise Exploratória de Dados
Gráfico de Box-and-whisker Usa o “Esquema dos 5 Números” e
constrói os Box Plots
Mediana( )
4 6 8 10 12
X maiorXmenor
1Q 3Q2Q
Nevembro/2004 FEG & FOSJC20
Formato da Distribuição e o Gráfico
Box-and-Whisker
Assimétrica à direita
Assimétrica à esquerda Simétrica
1Q 1Q 1Q2Q 2Q 2Q3Q 3Q3Q
Nevembro/2004 FEG & FOSJC21
Coeficiente de Correlação
Mede o grau da relação linear entre duas variáveis quantitativas (X e Y)
1
2 2
1 1
n
i ii
n n
i ii i
X X Y Yr
X X Y Y
Nevembro/2004 FEG & FOSJC22
Aspectos do Coeficiente de Correlação
Adimensional
Varia entre –1 e 1
Mais perto de –1, mais forte a relação linear negativa
Mais perto de 1, mais forte a relação linear positiva
Mais perto de 0, mais fraca é a relação linear
Nevembro/2004 FEG & FOSJC23
Diagramas de Dispersão (Scatter Plots)
Y
X
Y
X
Y
X
Y
X
Y
X
r = -1 r = -.6 r = 0
r = .6 r = 1