Upload
internet
View
111
Download
8
Embed Size (px)
Citation preview
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Prof. Cezar Augusto Cerqueira – UPE/UNICAP
CURSO DE ESTATÍSTICA BÁSICA
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Incerteza e Probabilidade
Entendimento de fenômenos aleatórios; presença do acaso; raciocínio diferente do lógico matemático, dedutivo.
Probabilidade –sec. XVI Cardano; sec. XVII – Pascal e Fermat (1654); jogos de azar.
Huyghens (1657); Bernoulli (1713); DE Moivre (1733); Bayes (1763); Laplace (1812); Gauss (1823), entre outros
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Incerteza e Probabilidade
Escolhas entre diferentes possibilidades A aleatoriedade está presente em diversos
fenômenos Demografia: nascimentos, óbitos Saúde: ocorrências de doenças; epidemias... Direito: criminalidade Engenharia: resistências de peças, qualidade,
tempo de vida de peças, problemas de trânsito, etc
O mundo é probabilístico Vivemos rodeados por fenômenos casuais
ou aleatórios.
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
ESTATÍSTICA: UMA VISÃO GERAL
ESTATÍSTICA Ciência de coletar, organizar, interpretar
dados Visando...tomada de decisões
ESTATÍSTICAS Somos bombardeados por elas a todo
momento Números, informações, indicadores...
Sociais, econômicos, demográficos, gerenciais
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
ESTATÍSTICA: UMA VISÃO GERAL
Compreensão a partir dos dados Origens
“status”; Estado; estado das coisas. Evolução
Contagens de habitantes; terras, tributação; guerras; religião.
Ciências físicas Ciências agrárias, biológicas, comportamentais Decisões econômicas, financeiras, empresariais
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
ESTATÍSTICA: POR QUE CONHECÊ-LA?
Gestores modernos lidam com grande quantidade de informação.
Tomada de decisões “bem informadas“ Apresentar e descrever de forma
apropriada as informações Tirar conclusões sobre grandes
populações com base em amostras Melhorar processos Obter previsões confiáveis
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
ESTATÍSTICA: FATORES IMPULSIONADORES
Necessidade de dados Desenvolvimento da matemática Desenvolvimento da informática
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
A estatística reúne métodos para:
Coleta Processamento Análise e interpretação de dados
Informações numéricas analisadas servem de base para tomada de decisões;
As estatísticas nos auxiliam a entender melhor os fenômenos em geral;
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
GRANDES ÁREAS EM ESTATÍSTICA:
ESTATÍSTICA DESCRITIVA PROBABILIDADES INFERÊNCIA
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
ESTATÍSTICA DESCRITIVA
Descrição
Organização
Resumo
Tabelas
Gráficos
Medidas
Técnicas Visuais
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
PROBABILIDADE Teoria matemática utilizada para se estudar a
incerteza, oriunda de fenômenos de caráter aleatório.
INFERÊNCIA ESTATÍSTICA Trata da análise e interpretação de dados
amostrais O principio básico é tirar conclusões sobre a
população a partir de uma amostra de dados obtida da mesma.
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
População
Amostra
Descrição Análise Inferência
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
PRODUÇÃO DE DADOS: UMA PALAVRA SOBRE FONTES DE DADOS
Obter dados já publicados por fontes governamentais, industriais ou individuais.
Planejar e executar um experimento para obter os dados necessários.
Planejar e executar uma pesquisa ou levantamento de campo (estudo observacional).
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Indivíduo e Variável
Indivíduos: objetos descritos por um conjunto de dados (pessoas, empresas, municípios, animais, ações, tempo, etc)
Variáveis: qualquer característica de um indivíduo, podendo assumir diferentes valores, de acordo com o indivíduo a que se refere.
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
OBSERVAÇÃO versus EXPERIMENTO
Estudo observacional Investiga indivíduos e mede variáveis de
interesse, sem influenciar as respostas ou sem modoficar os sujeitos objetos de estudo.
Experimento Impõe-se algum tipo de tratamento
sobre os indivíduos, a fim de observar suas respostas
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Levantamentos amostrais
População Grupo inteiro de indivíduos sobre o qual
se deseja informações Amostra
Parte da população da qual se coletam de fato informações, utilizadas para se tirarem conclusões sobre o todo.
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Aleatória simples
Estratificada
PROBABILÍSTICA Sistemática
Grupos (cluster)
Multifásica
AMOSTRAGEM
(Tipos)
NÃO PROBABILÍSTICA
Amostragem
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Aleatorização e estrtégias amostrais
Amostra não-probabilística Auto-seleção, conveniência, cotas, etc
Amostra probabilística Cada membro tem uma chance conhecida (mas
não necessariamente igual de ser selecionada) Amostra Aleatória Simples
Toda amostra possível de tamanho n tem igual chance de ser selecionada.
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Aleatorização e estratégias amostrais
Amostragem Sistemática Sorteamos um ponto inicial e, em seguida, cada kº
elemento fica automaticamente selecionado (por exemplo o 10º)
Amostragem Estratificada Subdividimos a população em, pelo menos, dois
subgrupos (estratos) de modo que os elementos do mesmo subgrupo compartilhem as mesmas características e, em seguida, extraímos uma amostra em cada subgrupo.
Amostragem por Conglomerado Inicialmente dividimos a área da população em seções
(conglomerados), depois selecionamos aleatoriamente alguns desses conglomerados e a seguir escolhemos todos (ou parte) dos membros desses conglomerados selecionados.
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
APRESENTAÇÃO DE DADOS: Tipos de variáveis
QUALITATIVAS Nominais (sexo, região...) Ordinais (grau de instrução)
QUANTITATIVAS Discretas (número de defeitos) Contínuas (peso, altura...)
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
O Banco de Dados
Nome Idade Sexo Renda (Sal. Min) InstruçãoJosé 27 Masc 5,32 SuperiorCatarina 30 Fem 6,43 2 GrauPedro 21 Masc 1,20 1 GrauCibele 22 Fem 2,33 2 GrauHelena 25 Fem 3,56 2 GrauMarta 20 Fem 1,70 1 GrauCarolina 35 Fem 4,50 TécnicaJuan 45 Masc 8,00 Superior
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
GRÁFICOS SIMPLES: VARIÁVEIS GRÁFICOS SIMPLES: VARIÁVEIS CONTÍNUASCONTÍNUAS
o o o o o o 3 4 5 6 7 8
Diagrama de Pontos
Considere os dados: 3 4 4,5 4,5 6 8
Exibem: Dispersão, conglomerados de pontos, lacunas, outliers, comparações
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
GRÁFICOS SIMPLES: VARIÁVEIS GRÁFICOS SIMPLES: VARIÁVEIS CONTÍNUASCONTÍNUAS : Gráfico Ramo-e-Folhas
Exemplo: Considere os dados abaixo representando a resistência à compressão de uma amostra de 80 corpos de prova de liga de alumínio:
105 221 183 186 121 181 180 143
97 154 153 174 120 168 167 141245 228 174 199 181 158 176 110163 131 154 115 160 208 158 133207 180 190 193 194 133 156 123134 178 76 167 184 135 229 146218 157 101 171 165 172 158 169199 151 142 163 145 171 148 158160 175 149 87 160 237 150 135196 201 200 176 150 170 118 149
Ramo Folha Frequencia
7 6 18 7 19 7 1
10 51 211 580 312 103 313 413535 614 29583169 815 471340886808 1216 3073050879 1017 8544162106 1018 361410 719 960934 620 7108 421 8 122 189 323 7 124 5 1
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Distribuições de frequência: Caso contínuo - Histograma
Tabela 2.3 Distribuição de freqüências das rendas dos empregados
do setor de produção
CLASSE DE RENDA(sal.min.)
Freq. simples(fi)
Freq. Relativa Freq. Acumulada (Fi)
4 |----- 8 7 14,0 7 8 |----- 12 8 16,0 15 12 |----- 16 20 40,0 35 16 |----- 20 10 20,0 45 20 |----- 24 5 10,0 50 TOTAL 50 100,0 -
Distribuição dos salários dos empregados do setor de produção
0
5
10
15
20
25
6 10 14 18 22
sal.min.
freq
. si
mp
les
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Apresentação de DadosDistribuições de frequências: caso nominal
Tabela 2.1 Empregados do setor de produção, segundo o grau de instrução, 2005.
GRAU DE INSTRUÇÃO Freqüência (fi) Primeiro Grau 15 Segundo Grau 25 Superior 10 TOTAL 50 FONTE: Pesquisa direta
Empregados do Setor de Produção, segundo grau de instrução - 2000
30%
50%
20%
Primeiro Grau
Segundo Grau
Superior
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Distribuições de frequência: Caso discreto
Tabela 2.2 Distribuição do número de filhos dos empregados do setor de produção
NÚMERO DE FILHOS Freqüência ( fi) 0 5 1 10 2 20 3 9 4 6
0
2
4
6
8
10
12
14
16
18
20
freq.
0 1 2 3 4
filhos
Número de filhos
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Gráfico de Sequencias no tempo
100
120
140
160
180
200
220
240
260
280
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Os dados representam a resistencia à compressão de uma amostra de 20 conectores plásticos:
241 194 190 209258 225 250 212237 190 240 123210 250 190 178189 220 180 190
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Distribuições de frequência: Gráfico de Pareto
Tabela 2.4 – Defeitos encontrados em uma amostra de lentes fabricadas pela indústria
Tipo de Defeito Freqüência de defeitos
Total Acumulado
Freqüência relativa (%)
Percentual Acumulado
Revest. Inadequado 55 55 43,3 43,3 Trinca 41 96 32,3 75,6 Arranhão 12 108 9,4 85,0 Espessura inadequada 11 119 8,7 93,7 Mal-acabada 5 124 3,9 97,6 outros 3 127 2,4 100,0 Total 127 - 100,0 -
FONTE: Indústria de lentes 0
10
20
30
40
50
60
Re
vest.
Ina
de
qu
ad
o
Trin
ca
Arra
nh
ão
Esp
essu
rain
ad
eq
ua
da
Ma
l-aca
ba
da
ou
tros
0,0
20,0
40,0
60,0
80,0
100,0
defeitos
% Acum
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Gráfico de Pareto Para causas: equipamentos, insumos,
informação do processo ou medidas, condições ambientais, pessoas, métodos ou procedimentos.
Para efeitos: qualidade, custo, entrega, segurança, etc.
Expresso em unidades monetárias Gráfico de Pareto estratificado (por operador,
etc) Comparações tipo antes e depois Desdobramento de gráficos de Pareto (causas e
sub-causas)
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
RESUMO NUMÉRICO DE DADOS QUANTITATIVOS: LOCALIZAÇÃO DO
CENTRO DOS DADOS
Média Aritmética
Mediana Valor do meio em uma sequencia ordenada de dados
Moda Valor mais frequente de uma série de dados
n
XiX
n
i 1
n
fXX
k
iii
1Dados brutos
Dados agrupados
2
)1]2/([)2/( nn
e
XXM
)2
1(
nX “n” ímpar “n” par
cf
FnLiMe
Me
ant .])5,0[(
Dados agrupados
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
OUTRAS MEDIDAS DE LOCAÇÃO: Quartis
Primeiro Quartil 25% das observações são menores e
75% maiores
Segundo Quartil (Mediana) Terceiro Quartil
)4
1(
1 nXQ
)4
)1(3(
3 nXQ
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
VARIABILIDADE
Medidas de tendência central podem mascarar importantes aspectos em uma série de dados
Um processo de produção de bens e fornecimento de serviços sempre apresenta variabilidade
A variabilidade é resultado de uma série de
alterações nas condições sob as quais as
observações são tomadas.
matérias-primas, condições de equipamentos, métodos de
trabalho, condições ambientais e operadores
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
VARIABILIDADE: Problematizando Os dados abaixo referem-se a notas obtidas em 3
turmas de 5 alunos cada: Turma A: 3 4 5 6 7 Turma B: 1 3 5 7 9 Turma C: 5 5 5 5 5
Em termos de tendência central como podemos analisar os grupos ?
E em termos de dispersão? Qual deles parece mais disperso? E qual deles apresenta maior variabilidade?
Façamos uma investigação gráfica do fenômeno. Como obter uma medida de variabilidade média
para os grupos?
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
MEDINDO A VARIABILIDADE
Variância Populacional
Variância Amostral
Desvio Padrão Corresponde à raiz quadrada da
variância
])(
[1
222
n
XX
ni
i
])(
[1
12
22
n
XX
ns
i
i
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
MEDINDO A VARIABILIDADE: outras medidas
Amplitude Total Xmax-Xmin
Amplitude Interquartil J = Q3–Q1
Coeficiente de variação
Comparação de grupos muito diferentes Comparação de dispersão com escalas
diferentes
X
S
média
padrãoDesvioCV
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
ESTUDO DA FORMA: ASSIMETRIA
Curva Simétrica
Distribuição dos salários dos empregados do setor de produção da Companhia A
0
5
10
15
20
25
30
6 10 14 18 22
sal.min.
freq
. sim
ple
s
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
ESTUDO DA FORMA: ASSIMETRIA
Assimetria Positiva
Assimetria Negativa
Distribuição dos salários dos empregados do setor de produção da Companhia B
0
2
4
6
8
10
12
14
16
6 10 14 18 22
sal.min.
fre
q.
sim
ple
s
Média > Mediana
Distribuição dos salários dos empregados do setor de produção da Companhia C
0
2
4
6
8
10
12
14
16
6 10 14 18 22
sal.min.
fre
q. s
impl
es
Média < Mediana
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Gráfico Box-Plot
Juntas: Q1,Q2,Q3
Extremos: E1 e E2
E1 Q1 Me Q3 E2
REGIAO
COSULSENENOID
HM
UN
1.0
.9
.8
.7
.6
.5
.4
Índice de Desenvolvimento Humano no Brasil, por Região - 2000
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
EXPLORANDO A RELAÇÃO ENTRE VARIÁVEIS
Mensurar o tipo e grau de associação entre duas ou mais variáveis.
Foco inicial: duas variáveis quantitativas Etapas:
Abordagem gráfica: diagrama de dispersão Cálculo do coeficiente de correlação linear de
Pearson,
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
CORRELAÇÃO: diagrama de dispersão
Gráfico que representa no plano cartesiano duas variáveis quantitativas
Ferramenta simples que permite aprofundar o estudo da associação entre 2 variáveis.
Como ilustração, considere a tabela abaixo, que representa o tempo de serviço e o volume de vendas semanais de uma amostra de 5 vendedores de determinado produto:
5550424035Vendas
86431Tempo (anos)
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Diagrama de Dispersão
0 1 2 3 4 5 6 7 8 9
3 5
4 0
4 5
5 0
5 5Y
ve
nd
as
X te m p o
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
CORRELAÇÃO
Quando as variáveis crescem no mesmo sentido temos o caso de correlação positiva.
Quando as variáveis crescem em sentidos opostos temos uma correlação negativa.
Se os dados estão perfeitamente alinhados sobre uma reta temos uma correlação perfeita.
Quando o crescimento de uma variável é acompanhado de variações casuais da outra variável a correlação é nula.
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
CORRELAÇÃO: diagrama de dispersão
50
70
90
110
130
150
170
190
210
0 20 40 60 80 100 120X
Y
Correlação Perfeita Negativa
r = -1
50
60
70
80
90
100
110
40 50 60 70 80 90 100 110X
Y
Correlação Perfeita Positiva
r = +1
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
CORRELAÇÃO: diagrama de dispersão
0
50
100
150
200
250
300
350
0 20 40 60 80 100 120X
Y
Correlação Forte e Positiva
r = 0,97
0
50
100
150
200
250
0 20 40 60 80 100 120X
Y
Correlação Forte e Negativa
r = -0,94
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
CORRELAÇÃO: diagrama de dispersão
0
20
40
60
80
100
120
0 2 4 6 8 10 12X
Y
0
10
20
30
40
50
60
70
80
0 2 4 6 8 10 12X
Y
Correlação Fraca
r 0Correlação Não-Linear
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
COEFICIENTE DE CORRELAÇÃO LINEAR: FÓRMULA DE CÁLCULO
YYXX
XYXY SS
Sr
n
YXXYS XY
n
XXS XX
22
)(
n
YYSYY
22
)(
onde:
Lembre que: -1 rxy 1
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
COEFICIENTE DE CORRELAÇÃO LINEAR: CÁLCULO PARA O EXEMPLO ANTERIOR
Elemento Tempo (anos) Vendas X2 Y2 XY1 1 35 1 1225 352 3 40 9 1600 1203 4 42 16 1764 1684 6 50 36 2500 3005 8 55 64 3025 440
Total 22 222 126 10114 1063
106310114;126;222;22 22iiiiii YXeYXYX
2,295
22126
)( 222
n
XXS xx
2,2575
22210114
)( 222
n
YYS yy
2,865
)222)(22(1063
))((
n
YXXYS xy
995,0)2,257)(2,29(
2,86
yyxx
xyxy
SS
Sr Indica uma
associação forte e positiva !!
CUIDADO!!! Correlação não implica em relação de causa efeito. !!
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
REGRESSÃO LINEAR SIMPLES
O diagrama de dispersão pode revelar importantes
informações acerca da relação entre duas variáveis X e Y
Quando os pontos traçados no diagrama de dispersão se
agrupam em torno de uma reta, podemos obter a equação
dessa reta e assim determinar um modelo matemático para a
relação entre as variáveis
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
O modelo de regressão linear simples
Yi = A + BXi + ei, onde: Yi = variável dependente ou variável
resposta. Xi = variável explicativa A = coeficiente linear da reta ou ponto de
interseção de Y B = coeficiente angular da reta ou
inclinação. ei = variável residual
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
O coeficiente linear da reta corresponde ao ponto onde a mesma corta o eixo-Y, ou seja, o ponto onde o valor da variável explicativa X é zero.
A inclinação indica o quanto varia a média da variável Y para o aumento de uma unidade na variável X.
A reta de regressão pode ser estimada pelo método dos mínimos quadrados, resultando na expressão:
ii bXaY
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Os valores dos coeficientes linear e angular resultantes desse processo de minimização podem ser escritos como:
A qualidade do ajuste pode ser avaliada pelo coeficiente de determinação (R2), que mede a proporção de variação na variável dependente que pode ser explicada pelo modelo linear ajustado.
R2 [0,1], quanto mais próximo de 1, melhor o poder explicativo do modelo.
xbyaeS
Sb
XX
XY
yy
xy
S
bSR 2
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
RELAÇÕES ENTRE VARIÁVEIS: QUANTITATIVAS X
QUALITATIVAS
Comparação do Comportamento de uma Variável Contínua por Grupos
Captar diferenças: i)nos níveis médios, ii)em variabilidade, iii)na forma da distribuição, iv)detalhes individuais. Via: Diagrama de Pontos Gráficos tipo Box-Plot Gráfico Ramo-e-Folhas
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
RELAÇÕES ENTRE VARIÁVEIS: AMBAS QUALITATIVAS
Tabela de contingência a 2 fatores Variável dependente e explicativa Medir associações Encontrar distribuições percentuais Distribuições marginais Distribuições condicionais
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
RELAÇÕES ENTRE VARIÁVEIS: AMBAS QUALITATIVAS
Escolha de áreas de estudo por sexo
Mulheres HomensContábeis 68 56Administração 91 40Economia 5 6Finanças 63 59
SexoÁrea
Exemplo:
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
RELAÇÕES ENTRE VARIÁVEIS: AMBAS QUALITATIVAS
Exemplo: percentuais de linha
Mulheres HomensContábeis 54.8 45.2 100.0Administração 69.5 30.5 100.0Economia 45.5 54.5 100.0Finanças 51.6 48.4 100.0Total 58.5 41.5 100.0
Total
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
RELAÇÕES ENTRE VARIÁVEIS: AMBAS QUALITATIVASExemplo: representação gráfica
0
10
20
30
40
50
60
70
80C
ontá
b
Adm
inis
t
Eco
n
Fin
an
Mulheres
Homens
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
NOÇÕES DE PROBABILIDADE Lançamento de uma moeda
2 resultados possíveis: cara e coroa Equiprováveis Moeda equilibrada (honesta)
Qual a probabilidade de dar cara?
Experimento de lançar “n” vezes e calcular a frequencia relativa de caras. (Kerrick, Bufon)
Abordagem empírica Probabilidade tende para ½.
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
NOÇÕES DE PROBABILIDADE PROBABILIDADE:
Modelos probabilísticos (a priori) Empirica (a partir de dados) Subjetiva
Modelos Probabilísticos simples Espaço Amostral (S): conjunto de todos os
resultados possíveis de um experimento aleatório. Evento: subconjunto do espaço amostral Coleção de resultados com ao menos uma
característica em comum Lista de resultados e respectivas probabilidades
Operações com eventos
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
PROBABILIDADE: algumas regras
1)Seja A um evento qualquer, então 0 P(A) 1.
2) Seja Ac o chamado evento complementar de A, então P(Ac) = 1 – P(A).
3) P(A B) = P(A) + P(B) – P(A B), sendo A e B eventos quaisquer.
4) P() = 0. 5) Se A e B são excludentes (P(A B)=),
então: P(A B) = 0.
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
NOÇÕES DE PROBABILIDADE: probabilidade condicional
A probabilidade de B, sendo A conhecido é dada por:
Dois eventos A e B são independentes se: )(
)()|(
AP
BAPABP
)()()( BPAPBAP
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Variáveis Aleatórias
São variáveis numéricas cujos resultados podem variar de uma realização para outra do experimento.
Tipos Discretas - contagem
Contínuas - medição
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Variáveis Aleatórias Discretas: distribuição de probabilidades
Valores de X e respectivas probabilidades:
Média Valor esperado):
Variância:
Pn......p3p2p1P(X)
Xn......X3X2X1X
)()( iix XPXXE
)()()( 222 XEXEXVX
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Modelos Probabilísticos para variáveis Discretas:
Distribuição de Bernoulli
Experimentos com apenas 2 resultados possíveis: Sucesso e fracasso. Lançamento de uma moeda Uma peça é escolhida de um lote e
classificada como defeituosa ou perfeita. Um indivíduo é selecionado e pergunta-
se se é ou não favorável ao desarmamento.
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Modelos Probabilísticos para variáveis Discretas: Distribuição de Bernoulli
Seja p=Prob. de Sucesso (1-p)=Prob. de fracasso Definimos a VA X com valores:
1 se ocorre sucesso 0 se ocorre fracasso
Distribuição de Probabilidades de X:
E(X)=p e V(X)=p(1-p)
1P1-pp(x)
total
10X
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Modelos Probabilísticos para variáveis Discretas:
Distribuição Binomial Considera n repetições independentes de um
experimento de Bernoulli. Exemplos:
Jogue uma moeda 10 vezes. Seja X=nº de caras obtido Uma máquina produz 1% de peças defeituosas. Seja
X=nº de peças defeituosas nas próximas 25 produzidas.
Nos próximos 30 nascimentos em uma maternidade, seja X=nº de meninas observado.
Seja a VA X=nº de sucessos obtidos. Portanto:
E(X)=np e V(X)=np(1-p)
nkppkXP knknk ,.....,1,0,)1()(
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Modelos Probabilísticos para variáveis Discretas:
Distribuição de Poisson Largamente empregada quando se deseja contar
o número de eventos de certo tio que ocorrem em um intervalo de tempo, superfície ou volume.
Exemplos: Fórmula:
Número de chamadas telefônicas recebidas em uma central em um intervalo de tempo.
Número de falhas em um computador em um dia de operação.
Número de defeitos em uma chapa de metal de 1 m2 produzida.
!
)()(
k
tekXP
Kt
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Modelos Probabilísticos para variáveis contínuas: Distribuição Normal
O exame dos gráficos de freqüência sugere a curva representativa da distribuição da variável.
As curvas de distribuição permitem o cálculo de probabilidades sobre a Variável estudada.
A curva normal é uma das mais importantes e utilizadas na Estatística.
Muitas variáveis, na prática, seguem o modelo normal.
O Modelo Normal possui dois parâmetros: a média () e o desvio padrão ().
Notação X~N( , )
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Modelos Probabilísticos para variáveis contínuas: Distribuição Normal
Representação Gráfica:
Propriedades:1) A área sob a curva é igual a 1.2) A curva é simétrica em relação à sua média.3) f(x) tende para 0 quando X tende para +/- 4) A curva possui um ponto máximo em x = .
+ -
68%
ESTATÍSTICA APLICADA Prof. Cezar CerqueiraESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Distribuição Normal: uso da tabela
0 z
X
z
0 1
P(0<Z<1)
1
P(Z>1)
0,3413
0,5-0,3413
-1 0
P(Z>-1)0,5+0,3413
z=1,64
0 z
5%
Uso inverso da Tabela