Upload
luiz-andrade
View
303
Download
52
Embed Size (px)
DESCRIPTION
Â
Citation preview
.~COMPANHIA PARANA,ENSE DE ENERGIA ~. COPEL
__ ---~----------~ ..l, - -=--- """---~,Do"1
!Ii~.Il
'lO
I
!
"' 'liI!
uOuO, u.
, '
O,0,o-vOO, ç,L'O"..VO-.,-"-",,-O(;-LrO/'"':-v,OOO-..•uO "
.jJ
.0, ~l./
"-"'.V-(.:~
lo .•.•..••..-(.,••• J.~
V
,"•~ _:~----~".
'-'-~----------------------•....,
. I
!
,,-:-
...".,-.,;~"!"~"'" .
•..1
"'"
, i" .
Jorge Festa
ESTATÍSTICA - UMA CIÊNCIA EM DESTAQUE
Obs.: Essa introdução abriu o 10 Encontro de Profissionais e Estudantes de Estatística, realizado naUNICAMP, Campinas, em março de 1985.
Ao se falar em Estatística logo se lembra de apresentações numéricas, em tabelas ou em gráficos dosresultados da observação de fenômenos de massa, ou ainda, o elemento típico inferido dessaobservação. Na verdade se trata de um .conjunto de processos que tem por objetivo a observação,classificação e análise de fenômenos coletívos bem como a indução das leis a que tais fenômenosglobalmente obedeçam.A palavra estatistica significava, originalmente, uma coleção de informações de interesse para,o estadosobre população e economia. Essas informações são coletadas com o propósito de:' resumirconhecimentos e são indispensáveis para os governantes conhecerem a marcha de uma ,i nação eformularem programas de governo e de administração compatíveis. A mesma coisa pode-se' dizer deempresas e organismos como indústrias, hospitais, seguradoras, instituições de pesquisas agropecuárias,biológicas, etc, que necessitam estatisticas para controle e o planejamento de suas atividades. .Os métodos pelos quais a Estatística se utiliza são aplicáveis a todas as ciências. No entanto, alguns sãomais utilizados em uma área do que em outra. Assim, por exemplo, os métodos de controle estatísticode qualidade são mais utilizados na industria. Sua utilização vai desde o recebimento da matéria-prima,passando por todas as etapas de transformação, na inspeção de qualidade do produto, na fase deacabamento e terminando na colocação do produto acabado no mercado consumidor. Pode-se dizer quea utilização de métodos estatísticOs de controle de qualidade é hoje a grande responsável pelo sucessoda indústria japonesa em todos os setores de atividades, dominando grande parcela do: mercadointernacional. E claro que a utilização destes métodos não constituem nenhuma novidade mas o quedeve-se ressaltar é o caráter sério e racional com que os japoneses os impuseram em seu programaindustrial, com o emprego de profissionais capacitados.Os setores que necessitam do planejamento e da pesquisa, como é o caso da agropecuária, são os quemais se utilizam de modelos estocásticos e análises de comparações na determinação de espécies, tipos,etc, no sentido de melhorar, aumentar e prever safras e produções em geral, obtendo assim uma certasegurança em investimentos. Esses mesmos modelos e análises também são de elevada importãncia naindustria, e são empregados com os mesmos objetivos.Na área econômica, alguns métodos se destacam devido a sua utilização mais frequente, eprincipalmente aos excelentes resultados que podem proporcionar. Dentre eles pode-se mencionarrapidamente o estudo de séries temporais e análise de ajuste de curvas.Todo setor relacionado com o levantamento de dados de populações humanas, sendo assim pesquisasde mercado, ou de opinião pública, ou ainda, de ordem demográfica, estão freqüentemente se utilizandode técnicas de amostragem, que proporcionam confiabilidade nos resultados pretendidos,' além degrande redução nos custos do empreendimento.Não se trata aqui de expor todas as aplicações da Estatística que é vastíssima, mas senão deexemplificar algumas delas. De uma modesta origem, esta ciência cresceu e se desenvolveu nos últimosanos, e sua vasta utilização se deve principalmente ao surgimento de métodos computacionaiseletrônicos. Foi com o surgimento e rápido aperfeiçoamento dos computadores, que os métodosestatísticos puderam ser devidamente utilizados,Assim, alguns cursos superiores foram repensados, em função desse avanço, e tiveram seus currículosalterados, com a implantação de uma nova filosofia, em virtude do quadro que se apresenta.Enfim, apesar de nós brasileiros termos nos alertados um tanto tardiamente para a grande importãnciada Estatistica em todos os setores de atividades de um pais, esforços estão sendo envidados através denossas escolas, no sentido de termos profissionais capacitados nessa área. ,~.
PAgina nO fEstai/sUes G8nJ1
?;:"(,,;ç,c(;evt.-VC!
'"O\oitt
'""eti(;.)Cl,..;
"\,1VGc
IC
'"CCe<.i(.,
CC,..~
", '-""
"~",t.JQ
'-I.Uc:.r
"cçvo
~
Jorge Festa
Estatísticas Descritivas
1. Média_ 1 n
x=-Lx;n i=1
2. Mediana
i = menor inteiro [~ + 1] ' j =maior inteiro [~ ]
. (Xp) +X[j))" ' ..Mediana = J 2 = Q2 = 2 ' onde XI;) e X[i] e a estatístIca de ordem.
3. ModaA moda é a observação com maior freqüência ..
4. Média Geométrica
(
n )y.x. = fIx;
1=1
5. Variância
2 1 ~( _)2s =--L. Xi-Xn-l '=1
6. Desvio-padrão
s = ..fs'7. Erro Padrão
Sd = Y-.h.8. Minimo
Min = X[1)' o mínimo é a menor observação (se os valores forem ordenados ascendentemente).
9. MáximoMax = X[n)' o máximo é a maior observaçãó (se os valores forem ordenados ascendentemente).
lO.AmplitudeR = Max - Min = X[n) - X[I)' a amplitude R é a diferença entre o Máximo e o Mínimo.
'""\
OQO~OO ~OJ0,
°1;).61
:;1o'o~
• I
QIOIOOJ~ai()
oJoJ1°I:).O:CJI01o:
• I;).QJ8i.JIo;jlOIOi
•
OIOiJ
Eslallstica GenII Páginan" 2
o8C):)l}_J
Jorge Festa
Referencia:Snedecor, G.W. and Cochran, W.G. 1967. Statisticai Methods, sixth edition. Ames, Iowa: lowaState Univerty Press.
,I
PAginanD 3
. ~'
Estai/sOca Genú
3(n -1)'(n - 2)(n - 3)
n
n(n+I)L:(x, -x)'i=1
(n -IXn - 2)(n - 3)S4
n
nL:(xi - x)'i=1
(n -IXn - 2)s'
13.Intervalo Inter QuartilIQR = J3 - JI = Q3 - QI
12.Quartil Superior
. .. [3 n IJ' '" [3 nJI = menor InteIro 4+ , J = maIOr InteIro 4
(xP] + Xiii) " .J, = Q, = 2 ' onde XP] e Xiii e a estattsttca de ordem.
14.Assimetria "Skewness" - (missing if s=O or n<3)
15.Assimetria Padronizada "Standardized Skewness" - -N(O, 1) for n>I50Skewness
16.Curtose (Kurtosis)(missing if s=Oor n<4)
17.Curtose Padronizada (Standardized Kurtosis)kurtosis
11.Quartil Inferior
. . [n IJ' ... [nJi = menor InteIro "4 + , J = mator InteIro 4
(Xpl+X[j]) , , ...J I = Q, = 2 ' onde X[;j e Xiii e a estatlstlca de ordem.
18.Coeficiente de Variação
CV = ~.100x
'r'cc-ç(."(;i\;)t;.c:.
"~,,'C:~
t"ç;..ec;(,.;
olo.-CoI"'~CCCCceç
!C19cC:••••Ç:
"e.c-oti(..
"-fi(;c;:(;oc
Jorge Festa
Exemplo: Uma amostra de 26 observações referente a altura (em centímetros) dos alunos do cursode "Cálculo de Probabilidade Ir' foi realizada em determinado dia, onde forneceu os seguintesvalores:
A distribuição de freqüência para os valores observados da amostra segue abaixo:
~~n~d~~J;;~~hJ:.1Fr(o'\'lvoc'lI-';)~vI8hov, .
1 155.000 160.000 1.57.500 3 0.11.54 3 0.11.52 160.000 165.000 162.500 1 0.0385 4 0.1.543 165.000 170.000 167.500 4 0.1.538 8 0.3084 170.000 175.000 172.500 6 0.2308 14 0.5385 175.000 180.000 177.500 6 0.2308 20 0.7696 180.000 185.000 182.500 3 0.11.54 23 0.8857 1.85.000 190.000 1.87.500 2 0.0769 25 0.9628 190.000 ~95.000 1.92.500 o 0.0000 25 0.9629 195.000 200.000 1.97.500 1 0.0385 26 1..000
PAgina nD 4
(13)174(26)173
(12)176(25)157
(11)174(24)156
(10)165(23)170
~-----------------~~
oo()oO'oO~81
°I'0 'c I0'- ,O,Oi
I
O- ,OIOO
°O,0'oioQ0,
°I0,,:):J.:)OJOO_, IVi0!O'Q:)::).:)bO()
8()
OaÓ.)
>
(9)165(22)185
Median = ~74.
(8)175(21)165
Estatlslica Gemi
(6) (7)196 180(19) (20)174 156
(5)188(18)167
(4)179(17)178
St:andard Deviatíon = 9.72704.
tpper Relative Cumulatíve Cum. ReI.I..imi t Hi.dpoint Frequenay .Frequenoy Frequenoy Frequenoy
(3)180(16)175
LowerLimit:
(2)177(15)182
3 1.5016674 16"128 16015557(6) 17"103344412 17015567896 18"10023 180158~ ~9"1~ 1.9016
(1)173(14)162
As estatísticas fornecidas pela amostra são apresentadas abaixo:':!) ('1!>~; r"Vl lU-""!~I s" \v-'''~õ;I1Y '7t~fi<-1i& '>Variable: alturas
Sample sizeAverageMedianModaGeometria meanVarianoeStandard. deviationStandard errorMi.nímumHaxi=RangeLower quartiletpper quartíleInterquartíle rangeSJrewnessStandardized skslmessKurtosisSt:aDda.rcü.zedkurt:osisCoeff. of variationSum
Class
Mean = ~73.154.
26.H3.1.53846H4.165.~ 72. 890634.94.61.53859.7270441.90763
1.56.196.40.165.179.14.0.0476590.0992090.1.535510.1.598215.617573
4502. '
------------------------------------------------------:,-'--r-----,----€">tp l"Y'"a "",,"" J),4Hl frrJô Ii', yc, / 51-t<" "'" ~ 1e:d.J to! ''<:;1>b 'I
Stem-and":'leafcli.splay for alturas:/wút c ~ ~12 represents f1.2
Jorge Festa
Páginan" 5
"" _._~--
I
*
O.~32. 489~.4480.~77
Chisqnare
------_._~.~-_.__ ._-- ..,,
m
6.96.06.07.~
_. __ an
8396
m m
.- .•....•.__ ....
Estatlstica GemI
Observed EXpecêedFrequency Frequency
m
*
UpperLi.mit
m
~67.000H3.000H9.000
I*
..--~
I
Pelos resultados apresentados, que conclusões você pode afirmar, com seus conhecimentosestatísticos a respeito da distribuição dos dados. Obdece uma distribuiçãoNormal?
aê ar be~ow1.67.000H3.000
above 1.19.000
LowerLimít
Chísquare = 3.30634 with ~ d.£. Sigo ~eve~= 0.06901.3~
". lo' ",1-<>-,1),111A,,~'i~1'> /~ cvvcl vJl.A\'", h"V fio f~"'(' . _c__.__.__..f __ 4-_. --S-- __ . __ + • __ --1 -- ~ o, ~
.,
7t"wç
'"(;..,e(,;)
tJ
",eõ.ec.."IC'"\;.iC;.Q\.,.\..;{;;
""cccc~c"cc-C.c"QCCcccccec:.cooc... _o.
Diagrama de Dispersoes
oJOOo'OOOO\)ÇJ::JJ0,010,OO'OJC)OOJb°I0'01JOQOoi01O. ,OOOCJ I
bOOOCJQ'OO~ ,ao;
Jorge Festa
PáginanD 6EstatfsUca GetaI
SaDp.le Correl.at:í.ozu
y =A+Bx
n.:LXY-~:X'LY Lxy-nxyB= ------
n'Lx' -(Lx)' LX' - n(x')
A = LY - B.L x - y _ Bxn
---::Ia---
-- -----
160 166 160 166 170 176 180 186 190 196 200Amostra ordenada
Al.t:ara. B.sco.re1J1.0000 0.9847( 26) ( 26)0.0000 0.0000
0.984.7 1.0000( 26) ( 26)0.0000 0.0000
2.8
1.8
0.8
-0.1
.1.1
i!l'"~c2'":..,~u.,W
Altura em ao.
Teste de Normalidade para a amostra das alturas.
Alt:ara.ll
E.co.re.e
Valor tabelado:
Regressão Linear Simples:
••••
••••
••••
•••
••••
Jorge Festa
Origem do Termo Regressão
o uso do termo regressão deve-se a Francis Galton, por volta de 1885, quando investigava relaçõesentre caracteristicas antropométricas de sucessivas gerações. Uma de suas constatações era de que"cada peculiaridade de um homem é transmitida aos seus descendentes, mas, em média, numaintensidade menor". Por exemplo: embora pais com baixa estatura tendam a ter filhos também combaixa estatura, estes tem uma altura média maior do que a altura média de seus pais. O mesmo ocorre,mas em direção contrária, para pais com estatura altà. Esta afirmação pode ser melhor compreendidaobservando os dados usados por Galton, e representados abaixo. Se as caracteristicas permanecessemas mesmas de geração para geração, esperar-se-ia que a reta de regressão tivesse seu coeficienteangular próximo de 1. Em sua análise, Galton encontrou o valor 0,516, mostrando que a reta tende paraaquela paralela do eixo x e passando pela média (y = y). A este fenômeno da altura de os filhosmoverem-se em direção da altura média de todos os homens, ele chamou de regressão, e às vezes dereversão, tendo aparecido num artigo em 1885, no Joumal ofthe Anthropological Institute, com otítulo "Regression Towards Mediocrity in Hereditary Strnture". - Regressão para a Mediocridade emEstaturas Hereditárias, mediocridade aqui referindo-se a médio .
'" Observadoestimadovalor y =x
••••
••••••••••••••••~
~
•••••••
••••
184
180
176
172
168
164
160160 164
Media de alturas de filhos contraalturas composta dos pais
168 172 176altura dos pais
180 184
Os dados abaixo referem-se a outro experimento de Galton, dentro de uma mesma investigação,procurando investigar a relação entre o diâmetro em centésimos de polegadas de ervilhas pais (x) eervilhas filhas (y). Analise a reta de regressão para os dados e interprete os coeficientes .
Bíbliografia:BUSSAB, W.O. Análise de Variância e de Regressão, Atual, 1988 .
••••••••••••••••
•••
-••••
Diâmetros em 0,01 de polegadas de sementes de ervilhasPais (x) 15,0 16,0 17,0 18,0Filhos(y) 15,4 15,7 16,0 16,3
19,016,6
20,017,0
21,017,3
•••• Estat/sties GemI PdginanD 7
-------------------7~------------ ~
desta forma também valem:
PROBABILIDADEJorge Festa
Introdução:
'OOIO'OJJao0,o!o.
IO,oo6o,
oJOOOO01°IOOÇJO8JOCJOOo:Jà8;o'Jb;
IO:DJ
g,:]1
0,O:
PtJginano 8EstatlsUca Geral
i)nEA
ii) Se A E A, então A EA
i)nEA
ii) Se A EA, então A EAiii) Se A e B EA, então AuB EA
n n
T3. Se A"A2, •••• ,An EA, então UA, EA e nA, EAi=l i=1
Tt0EAT2. Se A e B EA, então AnB EA
Evento: Um evento A é um subconjunto do espaço amostral n. Se atribuirmos uma probabilidade a Atemos o evento aleatório.
Experimento é o processo de coletar dados relevantes para fenômenos que exibem variações em seusresultados.
Uma das ferramentas fundamentais da estatístíca é a probabilidade, que teve seu ínícío formal com ae!!COlhade jogos no século xvn. Escolha de jogos, como o nome índíca, ínclui ações como: rodar umaroleta, rolar um dado, lançar uma moeda, retirar uma carta, etc., apresentam resultados de incerteza.Antes de definirmos probabilidade vamos apresentar algUns enuncíados importantes que facilitarão oentendimento do assunto, tais como: .
Álgebra A: Uma álgebra A é uma classe de subconjuntos não vazia, do espaço amostrai n, que satisfazaos seguintes axiomas e teoremas:
Espaço Amostrai n é a coleção de todos os resultados distíntos possíveis de um experimento ç, e cadaresultado distinto é chamado evento simples, um resultado elementar ou um elemento - ponto - doespaço amostral.
Sigma-Álgebra A: Uma sigma-álgebra Aé uma classe de todos os subconjuntos do espaço amostrai n,satisfazendo:
ro ro
iii) Se A"A2, •••• ,AnAn+1.EA, então UA, EA e nA, EAi=1 i=1
desta forma uma sigma-álgebra é sempre uma álgebra, e portanto, também é fechada para a união,intercessão e complemento.
Espaço Amostrai de um Experimento Estatístico é o par (n, A), onde n é o conjunto de todos ospossíveis resultados do experimento e A é a sigma-álgebra de subconjuntos do espaço amostrai.
-. -----------------------------
área, comprimento ou volume.
Definição de Probabilidade Geométrica (Gnedenko):
00
A, Osto é, Ai nAj = 0, i '" j; i, j = 1,,2, ... ) e se UAi EA, entãoi=1
P(A) = area Aarea il
PAgina nO 9
- -- -~-
EslatlsJica GemI
00 00
P[UAil = LP[A']i=1 i=1
(i) P(A) 2: O(ii) P(il) = 1(iii) Se A" A2, ••• , é uma sequencia de eventos mutuamente exclusivos em
Definição Axiomática: Uma função de probabilidade P[.] é um conjunto de funções com domiIÚoA(uma álgebra de eventos) e contradomínio o intervalo [O, 1], que satisfaz os seguintes axiomas epropriedades:
P(A) = ~ = n° resultados favoraveis a An n° resultados possiveis
Definição Frequentista ou de Freqüência Relativa: A probabilidadeP(A) de um evento A é o limite
P(A) I. n A I' nOde ocorrencias de A
= 1m-= Im --------n ...• ro n n ...• ro n ensaios
Definição Clássica: Se um experimento pode ocorrer com n eventos mutuamente exclusivos eigualmente prováveis e se nAdesses eventos ocorrem com um certo atributo A, então a probabilidadede A é a fração nA/nou
Jorge Festa
Partição: Uma Partição de um espaço amostraI il, é uma coleção de subconjuntos mutuamenteexclusivos do espaço amostrai il, cujas uniões são iguais ao espaço amostraI il.Medida de Probabilidade
'"c""ti~Coeee~ecc..-ccc-o~oc'"ceccc~ccccCcCQcOC,ccccccõo,~
Jorge Festa
como P[AIB] é uma probabilidade, valem para ela todas as propriedades de probabilidade. A prova deque a proporção P[AB]IP[B] é uma probabilidade vem da verificação dos axiomas:
Espaço de Probabilidade: Um espaço de probabilidade é a tripla (n, A, P[.]), onde n é o espaçoamostrai, A é uma coleção de eventos e P[.] é uma função de probabilidade com donúnio em A.
Probabilidade Condicional: Se A e B são eventos em A, para um dado espaço de probabilidade (n,A, P[.]), a probabilidade condicional de um evento A dado o evento B, indicado por P[AIB] é definidopor:
oJO:)OOO,OOQOa"J' I.~ I
oQ ,o:
,
o'O'0'01J'o' ,oO.
I,...V.. IJOio01Q~~ ,
0,o,a'OoOoJoboooQoD6o
PAginan" tOEs/a/lstica Gmal
ro
A, ~sto é, Ai nAj = 0, i;t j; i.j = t,2, ... ) e se UAi EA, entãoi=1
PIÂS)PIAIS)= PIS) se PIS) ) O,desta fonna
PIAS] = P[S).P[AIS)= P[AJ.PISIA).
n n
P7. Se A" A2, ... , An EA, então PIUAi) $ELPIAi)i=l i=1
P1 P(0) = OP2. Se Al, A2•...• An são eventos mutuamente exclusivos em A, então
P3. Se A é um evento em A, então PIA) = 1- PIA)P4. Se Al e A2 EA então P[Ad = PIAfA2)+PIA~A2) ePIA, - A2) = PI~2) = PIA,)- PIAI,Y>.2)P5.Se A, e A2 EA entãoPIAl uAd = PIAd+PIA2)-PIAl nA2)P6.Se A, e A2 EAe Al c A2,entãoPIA1)$PIA2)
n n
PIUA,) = LPIAi)i=1 i=1
ro ro
PIUAiIS) = LP[A;iS)i=1 i=l
(i) P(AIS) = PIAS)' PIS)~ O(ii) P(QjS) = PlnSl' PIS)= PIS)' PIS)= 1(iii) Se A
"A2, •••• é uma sequencia de eventos mutuamente .exclusivosem
Propriedades:
. -Jorge Festa
Propriedades:
Regra da Multiplicação: Para um dado espaço de probabilidade (n, A, P(.]), se AI, A2, ... , Ao sãoeventos em A, para o qual PIA1.A2 .... An.-.] > O; então:
Página nO 11Esf8/lsUca GemI
~(i)P(AB] = P[A).P(B)O~P(AlB) = PIA) se P[B) > O(iii) P(BIA)= P[B) se P[A) > O
n
A EA. PIA) = LP[AIB;J.P(Bj)
j='
A E A, P(BkIA) = ~[AIBk ).P(Bk)
LP(AIB;J.P(Bjlj=1
n
n= UBj e PIBjl) O para j = 1, 2, ... ,n então para todo:j=l
n
n= UBj e PIBjl) O para j = 1, 2, ... ,n então para todo:j=I
Fórmula de Bayes: Para Um dado espaço de probabilidade (n, A, PI.]), se BI, B2, ... , Bn é umacoleção de eventos mutuamente disjuntos em A satisfazendo:
n n
P(UA;IB)= LP(A;IB)i==1 i=1
P3C. Se A é um evento em A,então P(AIB)= 1- P[AIB]P4C. Se A, e A2 EA então P(A,IB) = P[A,A2IB) +P(A,A2IB)P5C.Se A, e A2 EA entãoP(A, vA2IB)= P(A,IB)+ P(A2IB)- PIAI nA2IB)P6C. Se A, e A2 EA e A, cA2• entãoP(A,IB)~P(A2IBl
n n
P7C. Se A,. A2, ... , An EA, então P[UA;IBJ ~L P[A;IB)i=1 i=1
P1C.P[0IB) = OP2C. Se A,. A2, ... , An são eventos mutuamente exclusivos em A, então
Teorema da Probabilidade Total: Para um dado espaço de probabilidade (n, A, P(.]), se BI, B2, ... ,Bn é uma coleção de eventos mutuamente disjuntos em A satisfazendo:
P(A,.A2 .....An) = P[A,).P(A2IA,).P(A3IA,A2) ..... P[AnIA,.A2 ...An-,1'V (f>. (\ '0(\ CP'&) : ?(A ). ?("iJ\ h- ) 7 (C ( A (\'!l). 7 ('"P IA "Me)
Eventos Independentes: Para um dado espaço de probabilidade (n, A, PI.]), seja A e B dois eventosem A. Os eventos A e B são definidos ser independentes se e somente se, uma das condições foremsatisfeitas:
----------------------------------,~
Jorge FeslaPropriedades:
n. O evento aleatório A e A é independente de si mesmo se e somente se P[A) = O ou P[B) = 1.12. Se A e B são eventos aleatórios pertencentes a A, então: A e BC, ACe B e ACe BCtambém sãoindependentes.13. Se A e B são eventos mutuamente exclusivos pertencentes a A, então A e B são independentessomente se P[A) = O ou P[B) = O.
Esta/lstica GemI Pdginan" 12
oOQOO".. ,UO,ÜOJ'OOO?jo'01O01oiOIoi. ,o'o'Oa:---IVI:J.OoooooQ'OooooQoa()
oo::)C>oô~
.•.
-00
aleatória X.
Páginan' 13Estal/sUca GemI
00
(ii) J fx (x) dx= 1
Variável Aleatória Discreta: A variável aleatória X é dita discreta se o seu domínio é um conjuntofinito ou infinito enumerável, ou melhor, se existe um conjunto finito ou infinito enumerável de valores{Xl, X2,..., x", ... } cR, tal que X(W)E{X
"X2, •.. ,x" ...} 'v'WEO. AfunçãoP(X=x;), i= 1,.2, ..., n, ... é
chamada função de probabilidade da variável aleatória X.
00
(iQ:LP(X = x;! = 1i=-<X:J
Função de Probabilidade: A função de probabilidade da variável aleatória X discreta, representadapor P[X=x;) é qualquer função tal que para X(w)E{Xl'x2, ..• ,x" ...} 'v'wEO, tem-se:
(i) P(X = xj I~O
Variável Aleatória: Para um dado espaço (O, A, P[.]), uma variável aleatória indicada por. X é umafunção com domínio O e contradomínio os números reais, ~ que o eventoX-I(-00, x] = {w:X(w),.:;x} EA, 'v'x ER .
Função Distribuição (Acumulada): A função distribuição da variável aleatória X indicada por Fx(x),é uma função com domínio os números reais e contradomínio o intervalo [O, 1), que satisfaz:
Fx(x)=P(X":; xl =p[{w:X(W)":;xH 'v'xER.
Variável Aleatória Contínua: A variável aleatória X é dita continua se existe uma funçãofx(x) ~ O, tal,
que Fx(x)= P(X,.:;xl = J fx(t) dt,'v'x ER, e então f(x) é a função densidade de probabilidade da variável
Propriedades:
FI. Fx(x) é não decrescente, isto é, x,.:;y, Fx(x),.:;Fx(Y)F2. Fx(x) é continua á direita, isto é, se x, ,j..x, Fx(x,),j.. Fx(x)F3. Fx(-oo) = O' e Fx(oo)= 1, isto é, se x, ,j..-00, Fx(x,),j.. O e se x, t 00, Fx(x,) t t
Se X é uma variável aleatória continua, então Fx(x) pode ser obtida da fx(x) e vice versa.
F () Joof( )d f () d Fx(x) d . d'" .. Ix x = x U U ou x X = d x ,on exe llerenClave.-w
JoryeFesta
VARIÁVEL ALEATÓRIA, FUNÇÃO DISTRIBUIÇÃO, FUNÇÃO DE PROBABILIDADE EFUNÇÃODENSIDADEDE PROBABILIDADE"
j,
Função Densidade de Probabilidade: A função densidade de probabilidade da variável aleatória Xcontinua, representada por fx(x) é qualquer função tal que:
~'-cetco~o'"'"""cQeCir"'"""oCC(,cooCçccocc"ccccCbo
,
,
ESPERANÇA E MOMENTOS:
Média: Seja X uma variável aleatória. A média de X indicada por 11,oU.E[x], é definida por:
........,....
é)'OJ'JO:)JOO::J01oi::J:oiOsiOOO'
gl;j"
I
OIJ'b!
I'""VIO.01OOObOQ.OaQooo;:]
a~
JooobCi_ J
PAginanQ 14EstaI/sUes GenJI
Variância: Seja X uma variável aleatória, e seja 11,a E[X = x). A variância de X indicada por cr~ ouVar[X = x] é definida por:
Jorge Fesla
Determinação da distribuição da variável aleatória X: A distribuição de uma variável aleatória Xfica determinada por qualquer das seguintes funções:a) Função Distribuição Fx(x).b) Função de Probabilidade P[X = x]c) Função Densidade de Probabilidade fx(x)
d)Função Caracteristica 'I'x(t) = E[eilx)
Um conceito extremamente usual envolvendo vw;iável aleatória ou distribuição é a esperança.
i) E[X=x]= LX P[X=x) seXédiscreta
~ii) E[X = x] = f x fx(x) dx se X é contínua
Desvio-Padrão: Se X é uma variável aleatória, o desvio padrão de X, indicado por cr x' é definidocomo + .JVar[X = x) .
~ oiii) E[X = x] = f [1- Fx(x)]dx - f Fx(x) dx, para uma arbitrária variável aleatória X.
o -00
Obs.: E[X = x] é o centro de gravidade (ou centróide) da unidade de massa que é determinada peladensidade. "Medida de Locação"
i) Var[X=x] = L(X-llx)2p[X=x) sex é discreta.
Obs.: A variância de uma variável aleatória X é uma medida de espalhamento ou dispersão de dadensidade de X. "Medida de escala"
iii) Var[X = x] = f 2 x [1- Fx(x)+ Fx(-x)) dx - ll~ para uma arbitrária variável aleatória X.
~ii) Var[X=x] = f(X-llx)2fx(x)dx sexécontinua
Obs. Se X é uma variável aleatória, Var[X = x] = E[X - E(X)]2 = E[X2] - (E[X])2 se E[X2] existe.
Obs.: Se g(X = x) = X, então E[g(X = x)]= E[X = x] a média de X. Se g(X = x) = (x - 1l,)2 , entãoE[g(X = x)] = Var[X = x]
Expectância: Seja X uma variável aleatória e g(.) uma função com domínio e contradomínio os reais. Aexpectância ou valor esperado da função g(.) da variável aleatória X indicada por E[g(X = x)], édefinida por:
Jorge Festa
,
-~
VALOR ESPERADO DE UMA FUNÇÃO DE UMA VARIÁVEL ALEATÓRIA
i) E[g(X = x)] = Lg(x)P[X= x]se x é discreta
~ii) E[g(X = x)] = f g(X= x)fx (x) dx se x é contínua
Propriedades:i) E[ c] = c, OIide c é uma constanteii) E[c g(X = x)] = c E[g(X = x)], para uma constante ciii) E[Clgl(X = x) + C2g,(X = x)] = c] E[gI(X = x)] + C2E[g2(X = x)]iv)E[gl(X = x)] ::; E[g,(X = x)] se gl(X = x) ::;.g2(X = x)
~.•.------------------------------"cC-CeceQcocCé~ç~cc9oocóevoooccc~oCccêCecococcccoQ
Estaflslica Gemi PAginan" 15
Jorge Festa
LISTA DE EXERCícIOS
2) Considere o espaço amostral n={l,."2, 3, 4, 5, 6}. Mostre que a classe F = {0, {1,4}, {1,2,5},{3,4,6}, n} não é uma álgebra.
I) Suponha que n consiste dos elementos a, b, c e d. Seja B uma classe de subconjuntos de n, que nãoé uma álgebra e consiste dos conjuntos {a} e {b}. Enumere os conjuntos que contém a menor álgebracontendo {a} e {b}.
C).O:)OOàCJOOOOOObQ'O801d ,O:0101
•OI()
°IO,OOOO!01ÓOOOOOQOOOO()-OO:)O/'" "-
OO~
Página nO 16Estallslica Gemiprobabilidade.
9) Dado P[A]=O,5 e P[AuB]=O,6, encontre P[B] se: a) A e B são mutuamente exclusivos, b) A é B sãoindependentes, c) P[AlB]=O,4.
IlO) Mostre que a função, f(x)=--I['.b](x);-ao<a,b<ao é uma função densidade deb-a -
5) Considere 4 caixas. A caixa I contém 2000 componentes dos quais 5% são defeituosos. A caixa 2contém 500 componentes com 40% defeituosos. A caixa 3 contém 1500 componentes com 15%defeituosos e a caixa 4 contém 1000 componentes com 10% defeituosos. Selecionamos uma caixa aoacaso e dela retiramos um simples componente. a) Qual a probabilidade que o componente selecionadoseja defeituoso? b) Se o componente for defeituoso qual a probabilidade de que ele foi selecionado dacaixa I? Da caixa 2? Da caixa 3? Da caixa 4?
3) Considere o experimento de jogar uma moeda honesta 2 vezes, onde o resultado h=cara e t=coroa.a) Qual o espaço amostral deste experimento? b) Se a e b são 2 números positivos tais que a+b=l,assumindo que Pr{hh}=a2, Pr{th}=Pr{ht}=ab e Pr{tt}=b2 Qual a probabilidade de ocorrer cara no 1°lançamento? Qual a probabilidade de ocorrer cara no 2° lançamento? c) Podemos afirmar peloenunciado do item b, que o evento assegura uma função de probabilidade, isto é, Pr {n}= I? Porque?
6) Em um hospital foi verificado a seguinte relação: 5 em 100 homens são daltônicos e 25 em 1000mulheres são daltônicas. Se uma pessoa escolhida ao acaso é daltônica, qual a probabilidade que estapessoa seja homem? ~
4) Quatro candidatos AI, A2, A3 e A. disputam uma eleição ao governo de um detenninado estado.Uma prévia eleitoral mostra que suas chances de vencer são respectivamente 0,4; 0,3; 0,2 e 0,1. Asprobabilidades que eles venham a promover mudanças substanciais, nos problemas de saúde nesteestado, caso eleitos são respectivamente 0,6; 0,5; 0,4 e 0,3. Qual a probabilidade de ocorrer mudançassubstanciais, caso o candidato AI seja eleito? Caso o candidato A2 seja eleito? Caso o candidato A3 sejaeleito? Caso o candidato A. seja eleito?
8) Uma substância radiativa é selecionada em t=O e o tempo t da emissão desta particula é observada.Este processo define um experimento cujos resultados são todos os pontos do eixo t positivo. Suponhaque a função a(t) é dada por: a(t) = ce-ct, t>O. Qual a probabilidade que esta partícula seja emitida nointervalo (O, tO)?
t,
7) Seja t a idade de uma pessoa quando ela morre. A probabilidade to é dada por: Pr{T::; to} = J a(t)dto
onde a(t)=3xI0-9t2(lOO-t)2, O::;t::;IOOé uma função detenninada de uma tábua de mortalidade. a) Quala probabilidade desta pessoa morrer entre as idades de 60 e 70 anos? b) Qual a probabilidade destapessoa morrer entre as idades de 60 e 70 anos, dado que ela viveu mais que 60 anos?
-•.~--------------------------•••••••
••••••
•••
•••••
••••
•••
-•••
•••••
••••
•••••••
•••
••••
••••
••••
Jorge Festa
11) Uma companhia produz circuitos integrados em três fábricas, I, 11,11. A fábrica I produz 40% doscircuitos, enquanto a 11 e a ill produzem 30% cada uma. As probabilidades de que um circuitointegrado produzido por estas fábricas não funcione são 0,01, 0,04 e 0,03, respectivamente. Escollúdoum circuito da produção conjunta das três fábricas, qual a probabilidade de o mesmo não funcionar?
12) Considere a situação do problema anterior, mas suponha agora que um circuito é escollúdo aoacaso e seja defeituoso. Determinar qual a probabilidade de ele ter sido fabricado por I, por 11,por ill.
13) A urna Icontém duas bolas pretas e três brancas, ao passo que a urna 11contém três bolas pretas etrês brancas. Escolhemos uma urna ao acaso e dela extraímos uma bola, que tem cor branca. Se a bola érecolocada na urna, qual a probabilidade de se tirar novamente uma bola branca da mesma urna?
14) Um restaurante popular apresenta apenas dois tipos de refeições: salada completa ou um prato àbase de carne. 20% dos fregueses do sexo masculino preferem salada; 30% das mulheres escolhemcarne; 75% dos fregueses são homens. Considere os seguintes eventos:H: freguês é homem A: freguês prefere saladaM: freguês é mulher B: freguês prefere carne .Calcular: a) P(H), P(AjH), P(BIM); b) P(AnH), P(AuH); c) P(MIA).
15) Uma companhia de seguros analisou a frequência com que 2.000 segurados (1.000 homens e 1.000mulheres) usaram o hospital. Os resultados são apresentados na tabela:
Homens MulheresUsaram o hospital 100 150Não usaram o hospital 900 850
a) Qual a probabilidade de que uma pessoa segurada use o hospital? b) O uso do hospital independe dosexo do segurado?
16) Um empreiteiro apresentou orçamentos separados para a execução da parte elétrica e da parte deencanamento de um edificio. Ele acha que a probabilidade de ganhar a concorrência da parte elétrica éde 1/2. Caso ele ganhe a parte elétrica, a chance de ganhar a parte de encanamento é de 3/4; casocontrário, essa probabilidade é de 1/3. Qual a probabilidade de ele:a) ganhar os dois contratos;b) ganhar apenas um;c) não ganhar nada .
17) Em uma fabrica de parafusos, as máquinas A, B e C produzem 25, 35 e 40 por cento do totalproduzido, respectivamente. Da produção de cada máquina 5, 4 e 2 por cento, respectivamente, sãoparafusos defeituosos. Escolhe-se ao acaso um parafuso e verifica-se que é defeituoso. Qual aprobabilidade de que o parafuso venha da máquina A? Da B? Da C?
•••• Estatlstica Gelai PtJgina nO 17
Jorge Festa
18) A empresa M & B tem 15.800 empregados, classificados de acordo com a tabela abaixo.
Idade \ Sexo Homens Mulheres Totalmenor que 25 anos 2.000 800 2.800entre 25 a 40 anos 4.500 2.500 7.000maior ue 40 anos 1.800 4.200 6.000
Total 8.300 7.500 15.800
Se um empregado é selecionado ao acaso, calcular a probabilidade de ser ele:
a) um empregado com 40 anos de idade ou menos;b) um empregado com 40 anos de idade ou menos, e mulher;c) um empregado com mais de 40 anos de idade e que seja homem;d) uma mulher, dado que é um empregado com menos de 25 anos.
19) Obtenha uma fórmula para P(AuBuC)
20) Um sistema é composto de três componentes I, 2 e 3, com confiabilidade 0,9, 0,8 e 0,7,respectivamente. O componente I é indispensável ao funcionamento do sistema; se 2 ou 3 nãofuncionam, o sistema funciona, mas com um rendimento inferior. A falha simultânea de 2 e 3 implica onão funcionamento do sistema. Supondo que os componentes funcionem independentemente, calcular aconfiabilidade do sistema.
21) a) Encontre o valor da constante k tal que a função seguinte seja uma função densidade deprobabilidade (fd.p.).
b) Faça o gráfico da fd.p. encontrada.
22) a) Mostre que as funções abaixo são funções densidade de probabilidade (fd.p.):f,(x) = e-xI(o.~)(x)
fz(x) = 2e-zxI(o.~)(x)
f(x) = (6+1)f,(x)-6 fz(x), 0<6<1b) Prove ou disprove: "Se fi (x) e f2(x) são fd.p.'s e se 61+62=1, para 0<61,82 <I, então 8Ifl(x) + 82f2(x) é uma f.d.p."
23) Dada a função, fx(x) = 2e-zxIIO.~)(x).a) Mostre que esta é uma função densidade de probabilidade.b) Calcule a probabilidade de que X>lO.c) Calcule a probabilidade de que X esteja entre os valores 5 e 15.
24) Uma v.a. X tem distribuição triangular no intervalo [O, I] se sua fd.p. é dada por:fx(x) = CxI[O.lIZ)(x) + C(I- x)I[lIz.IJ(x)
a) Qual valor deve ter a constante C, de modo que fl:x) seja uma função densidade de probabilidade?b) Faça o gráfico da fl:x).c) Determine P{~l/2}, P{X>l/2} e P{l/4~/4}.
EstallsUca G8nI1 Página nO 16
-•••-••••, .
Jorge Festa
25) A v.a. X é distribuida normalmente com media 1000 e desvio-padrão 50.a) Encontre a probabilidade que X esteja entre 900 e 1100.b) Encontre a probabilidade que X esteja entre 850 e 1150 .
•••
•••
••••
26) Um experimento consiste em arremessar uma moeda Z vezes e registrar, a cada arremesso, a faceque caiu para cima: h=(cara) ou t=(coroa). Seja X o número de caras obtidas.a) Descreva extensivamente o espaço amostrai O, correspondente a este experimento. ...'L,'. f •..~.~!-I ~ U~b) Seja P={AQ,A},AZ} onde AQ={tt}, AI={ht,th} e A2={hh}. Mostre que P é uma partição de O e .determine, termo a termo, a álgebra A, de subconjuntos de O gerada por P (a menor sigma álgebra desubconjuntos de O que contém P).c) Podem-se definir, arbitrariamente, infinitas funções de probabilidade no espaço (O, A). Contudo sóuma destas funções terá perfeita coerência fisica com o experimento real, onde a moeda arremessada ébalanceada, isto é, com chances iguais de se obter h ou t em cada arremesso. Determine o valor destafunção para cada elemento de A.d) Seja P[.] a função determinada em c). Mostre que no espaço de probabilidade (O, A, P) X é umavariável aleatória.e) Determine a esperança e variãncia da variável aleatória X.
••••••
••••••••
•••
27) Considere uma amostra sem reposição de tamanho 2 retirada de uma urna contendo três bolasnumeradas de 1, Z e 3. Seja X o menor dos dois números observados, e Y o maior destes números.a) Descreva extensivamente, o espaço amostral O, correspondente a este experimento .b) Quais os valores que as variáveis aleatórias X e Y assumem conjuntamente?c) Encontre a função densidade discreta conjunta de X e Y (tabela de probabilidade conjunta).d) Determine a E(X), E(Y), Var(X) e Var(Y).e) Determine a Covariãncia e o coeficiente de correlação das variáveis aleatórias X e Y.
28) A v.a. X tem densidade gama fx(x) = c2x(2-1)e-OXI(o.oo)(x) .
a) Encontre a função distribuição.b) Calcule a média desta distribuição .c) Calcule a variãncia .
•••••
••••••'" 29) Mostre que se X é uma v.a. tendo distribuição simétrica em torno de zero, e se P(X=O)=O, então a.•••. distribuição condicional de xZ dado que X>o é igual a própria distribuição de X2••• Obs.: Dizemos que a distribuição de X é simétrica (em torno de zero) se P(X9c) = P(JQ-x), para todo•••. xe\R, ainda, P(X=O) = O=> P(~O) = P(JQO) = 1/2.
30) Seja X e Y v.a. com [d.p. conjunta dada por: fxy(x,y) = I(-x,x)(y) 1(0,1)(x).a) Mostre que f(x,y) é densidade ([d.p.).b) Calcule a E(X), E(y), V(X), V(Y), COV(X, Y).c) Calcule a E(XIy) e E(YIx).
••• 31) Se X tem distribuição Rayleigh, f(x) = 1 anxn-le-~I(o.oo>(x).(n-I)!
•••• a) Calcule E(X) e V(X) .
32) Considere uma urna contendo 3 bolas vermelhas e 5 pretas. Retire 3 bolas, com reposição e definauma v.a. X igual ao número de bolas pretas. Obtenha a distribuição de X. Faça o gráfico da distribuiçãode X, fx(x), e da função distribuição acumulada Fx(x).
•••• EstallsUca Geral PAginan" 19
Jorge Fesla33) Repita a questão anterior, mas considerando extrações sem reposição.
34) Uma urna contém 3 bolas vermelhas, 2 bolas brancas e I bola azul. Uma segunda urna contém Ibola vermelha, 2 bolas brancas e 3 bolas azuis.a) Uma bola é selecionada de cada urna. (i) Descreva o espaço amostrai deste experimento. (ii)Encontre a probabilidade de que as bolas sejam da mesma cor. (üi) A probabilidade de que ambas asbolas serem vermelhas é maior do que a probabilidade de ambas serem brancas?b) As bolas das duas urnas são misturadas em uma simples uma, e uma amostra de 3 bolas é retirada.Qual a probabilidade das 3 cores (vermelha, branca e azul) serem representadas quando a amostragemé feita: (i) com reposição, (ii) sem reposição.
35) Suponha que uma moeda perfeita é lançada até que cara apareça pela primeira vez. Seja X onúmero de lançamentos até que isto aconteça. Obtenha a distribuição da v.a. X. (Observe que, nesteproblema, pelo menos teoricamente, X pode assumir um número infinito enumerável de valores). Faça ográfico da distribuição de X, fx(x), e da função distribuição acumulada FX(x).
36) Uma moeda perfeita é lançada 4 vezes. Seja Y o número de caras obtidas. Obtenha a distribuição dav.a. Y.
37) Repita a questão anterior, considerando agora que a moeda é viciada, sendo a probabilidade de caradada por p, o<p<l, p;t1/2. Generalize para n lançamentos da moeda.
38) A v.a. contínua X tem função densidade de probabilidade, fx(x)= 3x2 1[-1,0)- Se b for um númeroque satisfaça a -I <b<0, calcule Pr[X>bIX <b/2].
39) Se X tem função densidade de probabilidade fx(x), calcule a densidade Y=X2 Sugestão: encontreprimeiramente a função distribuição acumulada Fy(y) de Y e depois a função densidade deprobabilidade fy(y)= F'y(y).
40) A demanda diária de arroz em um supermercado em centenas de quilos, é uma v.a. X com funçãodensidade de probabilidade fx(x) = 2/3x I[O,I)(X) - xl3+! I[1,3](X). Qual a probabilidade de em um diaescolhido ao acaso, de se vender mais do que 150 kg?
41) Examinaram-se 2.000 ninhadas de 5 porcos cada uma, segundo o número de machos. Os dadosestão representados na tabela abaixo.
J
-'
Número de MachosOI2345
Total
Número de Ninhadas20
36070068020040
2000
~
a) Calcule a proporção média de machos.b) Calcule, para cada valor de X, o número de ninhadas que você deve esperar se X:b(5,p), onde p é a
proporção média de machos calculada em a)..I
Estai/sUes GemI PAginan" 20
-...--------------------------------------
a) Calcule o número médio de acidentes por hora nesta amostra.b) Se o número de acidentes por hora seguisse uma distribuição de Poisson, com média igual a quevocê calculou, qual seria'o número esperado de dias com O, 1,2, ... etc.c) Os dados revelam que a suspeita dos operários é verdadeira ?
Você acha que o modelo binomial é razoável para explicar o fenômeno?
43) Houve uma denuncia por parte dos operários de uma indústria de que, toda a vez que ocorria umacidente em uma seção da indústria, ocorriam outros em outras seções mais ou menos no mesmohorário. Em outras palavras, os acidentes não estavam ocorrendo ao acaso. Para verificar esta hipótese,foi feita uma contagem do número de dias (24 horas por dia). Os resultados da pesquisa estão abaixo.
Jorge Festa
42) Na tabela abaixo, X significa número de filhos homens em famílias com 12 filhos, Calcule para cadavalor da variável o número de familias que você deveria esperar se X:b(12;0,5).
X Número,Observado de
FamíliasO 61 292 1603 5214 11985 19216 23607 20338 13989 79910 29811 6012 7
Total 10690
Estallslica GenJI PtJgina nD 21
Número deHoras2001526030139754
Número de Aciden-tes por Hora
O12345678
cc~ücÕÔc"coGCCGoCc8ocooe(;tec-,'occ'\Ioooç;(;cçcçcccocoo0,c
----------------------------------~
a) Calcular a média e a variância para cada variável.b) Supondo normalidade para cada uma destas variáveis com os parâmetros estimados pela amostra,calcule as frequências esperadas para cada classe.
Jorge Festa
44) Uma certa região florestal foi dividida em 109 quadrados para estudar a distribuição de PrimulaSimenses Selvagem: A priori, supomos que este tipo distribua-se aleatoriamente na região. O quadroabaixo indica o número de quadrados com X Primula Simenses; o número médio de plantas porquadrado foi de 2,2. . .....
a) Se as plantas realmente se distribuem aleatoriamente na região, qual a probabilidade de encontrarmospelo menos 2 Primulas?b) Dê as frequências esperadas para os valores de X=O, X=I, X=2, ... etc.c) Apenas comparando os resultados de b) com as frequências observadas, qual a conclusão a que vocêchegaria?d) Quais as causas que você daria para a conclusão?
45) Os dados abaixo representam uma amostra de empresas de um determinado ramo de atividade deuma região. Foram observadas duas variáveis: faturamento e número de empregados.
£stat/sdca Gen1/
'".JQoQoao,O'ooooo0-,
8.OOOo.dOOOOOOOOOOOOO~.) ,O:)OO:O',
IgiI
(1OOaoooO
PAgina nO 22
N° deEmpresas
185230262420161464
210
N° deEmpresas
357545301582
210
Número de Quadradoscom X Plantas
26212314114541O
N° de Empre-gadosOa20
20 a 5050 a 100100 a 200200 a 400400 a 800mais 800
Total
o aIO10 a 50
50 a 100100 a 200200 a 400400 a 800800 a 1600 -1600 a 32003200 a 6400mais 6400
Total
Faturamento
X Plantas porQuadrado
O12345678
acima de 8
-w---------------•••-•••••••••
••••••••••••••
-••••••••••
••••••••
••••
•••-••••••••••
•••
•••••••
Jorge Festa
46) Considere duas variáveis aleatórias X e Y tendo uma função densidade conjunta dada por:fxy(x,y) =e-(x+y)l(o,~)(x) l(o,~)(Y)
a) Encontre as densidades marginais de X e Y.b) As variáveis X e Y são independentes?c) Encontre a esperança de X e a esperança de Y.
47) Muitos experimentos são tais que os resultados possíveis apresentam ou não uma detenninadacaracteristica. Uma moeda é lançada: o resultado é "cara", ou não é; um dado é lançado: ou ocorre face5, ou não (ocorrendo, então, uma das faces 1,2, 3, 4 ou 6); uma pessoa é escolhida, ao acaso, entre osmoradores de uma cidade e pergunta-se se ela diz "sim" ou "não" a um projeto da prefeitura, Estesexperimentos resultam numa variável aleatória de Bernoulli e também são chamados "ensaiosBernoulli". A função de probabilidade discreta que uma variável aleatória, digamos, X assume é dadapela função de probabilidade:f(x) = pXql-xI(o,I)(x), O:S p:S I, (q = 1- p)a) Encontre a E(X).b) Encontre a Var(X)c) Encontre a função geratriz de momentos, Mx(t), da variável aleatória X.d) Através da função geratriz de momentos, encontre a média e a variância da variável aleatória X.
48) A dístribuição de Poisson é largamente empregada quando se deseja contar o número de eventos deum certo tipo, que ocorrem em um intervalo de tempo, ou superncie, ou volume. Esta distribuição échamada distribuição de eventos raros, tais como: número de chamadas telefônicas recebidas em umacentral durante um intervalo de tempo pequeno, número de falhas de um computador em um dia deoperação, número de acidentes ocorridos em um cruzamento, etc .. A sua função densidade discreta édada por:
fx(x) = ~e-ÀÀ.xI(o ~)(x)xl '
a) Encontre a média e variância da variável aleatória X.b) Encontre a função geratriz de momentos da variável aleatória X.c) Através da função geratriz de momentos, encontre a média e a variância da variável aleatória X.
49) A distribuição geométrica é a distribuição do tempo de espera até que ocorra o primeiro sucesso emuma sequência de ensaios Bernoulli com probabilidade p de sucesso. Suponha o lançamento de umamoeda, independentemente, não necessariamente honesta. Seja X o número de lançamentos até o dasaida de cara, inclusive, Dizemos então, que a variável aleatória X tem distribuição geométrica comparãmetro p, e a sua função de probabilidade é dada por:
fx(x) = p(l- P)(1-X)1(1,2...)(x)
a) Mostre que é uma função de probabilidade discreta.b) Encontre a média e a variância da variável aleatória X.Dica: O limite da soma de uma progressão geométrica. ilimitada é dada pela expressão:
lim S" = ~, onde q é a razão e aI é o primeiro termo.II-n. }- q
•••• EstallsUea Genú Página nO 23
54) Defina Variável Aleatória, apresentando exemplos, no caso discreto e continuo.
52) Considere a distribuição conjunta X e Y dada pela tabela abaixo:
a) Determine a E(X), E(Y), Var(X) e Var(Y).b) Determine a Covariância entre X e Y.c) Qual o valor do coeficiente de correlação, p(x, Y).d) As variáveis X e Y são independentes? Porque?
Y\X O I 2 P(Y=y)1 3/20 3/20 2/20 8/202 1/20 1/20 2/20 4/203 4/20 1/20 3/20 8/20
P(X=x) 8/20 5120 7/20 20/20
51OOOOdOOOOO-OOOOOOOOO01OOOOO,OIo.gloioiOOO:;OOOOO'61
o.01O
°Io:OO,,)
Ptlginan" 24Eslallstica GemI
55) Um experimento consiste em arremessar uma moeda 3 vezes e registrar, a cada arremesso, a faceque caiu para cima: h=(cara) ou t=(coroa). Seja X o número de caras obtidas antes de .ocorrer aprimeira coroa, e Y o número de caras obtidas.a) Descreva extensivamente o espaço amostral n, correspondente a este experimento.b)Seja n={Ao,A},A2,A3} onde Ao={thh,tht,tth,ttt}, Al={hth,htt}, A2={hht}e A3={hhh}. Mostreque S é uma partição de n e determine, termo a termo, a álgebra A de subconjuntos de n gerada por S(a menor sigma álgebra de subconjuntos de n que contém S).c) Podem-se definir, arbitrariamente, irifinitas funções de probabilidade no espaço (n, A). Contudo sóuma destas funções terá perfeita coerência fisica com o experimento real, onde a moeda arremessada ébalanceada, isto é, com chances iguais de se obter h ou t em cada arremesso. Determine o valor destafunção para cada elemento de Ad) Seja P a função determinada em c). Mostre que no espaço de probabilidade (n, A, P), X é umavariável aleatória.
53) As variáveis X e Y tem distribuição conjunta dada por:fxy (x,y) = (x + y)I(o.l)(x)I(o. I) (x)
a) Mostre que a distribuição acima é uma função densidade de probabilidade.b) Encontre as distribuições marginais de X e de Y.c) Determine a esperança de X e a esperança de Y.
Jorge Festa
50) Um experimento consiste em lançar dois tetraedros regulares, com faces numeradas de I a 4, eregistrar os números das faces voltadas para baixo. Seja X o maior ou igual dos números observados eY o menor ou igual dos números observados.a) Descreva extensivamente o espaço amostral correspondente a este experimento.b) Quais os valores que as variáveis aleatórias X e Y assumem conjuntamente?c) Construa a tabela de probabilidade conjunta de X e y'.d) Determine a E(X), E(Y), Var(X) e Var(Y), Cov(XY) e o coeficiente de correlação entre X e Y.51) Se XI, X2, ..., Xn são variáveis aleatórias independentes, cada Xi com a mesma média 11 e mesma
variância cr2
Calcule a E(x) e a Var(x), onde x = ~i Xin i=1
•
Jorge Festa
58) Se X e Y tem distribuição conjunta dada por, fxy(x,y) = 21(0.y)(x)l(o. j)(Y)'a) Encontre a Cov [X,Y).b) Encontre a distribuição condicional de Y dado X=x.
60) Considere uma amostra sem reposição de tamanho 2 retirada de uma urna contendo três bolas,numeradas de 1, 2 e 3. S~a X o menor dos dois números retirados e Y o maior.a) Encontre a função densidade conjunta de X e Y.b) Encontre a P[X=11 Y=l]c) Encontre a Cov[X, Y).
57) Um sistema é composto de três componentes 1,2 e 3, com confiabilidade C}, C2 e C3. Ocomponente Cl é indispensável ao funcionamento do sistema; se C2 ou C3 não funcionam, o sistemafunciona mas, com um rendimento inferior. A falha simultânea de 2 e 3 implica o não funcionamento dosistema. Supondo que os três componentes funcionem independentemente, com distribuiçãoexponencial com parâmetro (média) igual a 1, calcular a confiabilidade do sistema.
Páginan" 25Estallstica Gtm11
59) Considere uma amostra de tamanho 2 retirada sem reposição de uma urna contendo três bolas,numeradas de 1,2 e 3. Seja X o número da primeira bola retirada e Y o maior dos dois númerosretirados. ..a) Encontre a função densidade conjunta de X e Y.b) Encontre a P[X=11 Y=3]c) Encontre a Cov[X, Y).
61) Considere duas variáveis aleatórias X e Y tendo a função densidade de probabilidade conjunta:1
fxy (x,y) = "2xy 1(0.x)(y) 1(0.2)(x).
a) Mostre que fxy(x, y) é uma densidade.b) Encontre as distribuições marginais de X e Yc) X e Y são independentes, porque?
56) a) Mostre que as funções abaixo são funções densidade de probabilidade (f.d.p.):fj(x) = e-xI(o.~)(x)
f2(X) = 2e-2xI(0.~)(x)
f(x)=(6+1)fj(x)-6f2(x),0<6<1b) Prove ou disprove: "Se fl(x) e f2(x) são f.d.p.'s e se 61+62=1, para 0<61,62<1, então
6lt(x) + 62fix) é uma f.d.p."
62) Seja fxy (x, y) = e-(x+y)I(o.~)(x)l(o.~) (y).
a) Mostre que fXY(x,y) é uma densidade.b) Encontre as distribuições marginais de X e Yc) X e Y são independentes, porque?d) Encontre P[X> 1].
\)C'q,o9cO~OOc'éoQ9:e\3c.C'-'ooooéQ~
ºooQ.o"o\)Vo
ºc,ooooooocooQ
Jorge Festa
63) Um experimento consiste em lançar uma moeda honesta três vezes. Seja X a variável aleatória queindica o número de caras que ocorrem no primeiro e segundo lançamento, e Y, a variável aleatória queindica o número de caras que ocorrem no segundo e terceiro lançamento.a) Encontre a distribuição conjunta de X e Y.b) Encontre a distribuição condicional de Y dado X=1.c) Encontre a Cov[X, Y].
64) Considere o experimento de lançar 2 tetraedros (poliedros de 4 lados) regulares, com facesnumeradas de 1 a 4, e observar as faces dos tetraedros voltadas para baixo. Seja X a v.a. indicando aface do primeiro tetraedro observado e a v.a. Y indicando o. maior ou igual número das facesobservadas.a) Represente graficamente o espaço amostrai deste experimento.b) Quais os valores que as variáveis aleatórias X e Y assumem conjuntamente, associe a cada valor asua respectiva probabilidade.c) Encontre a Fxy(x,y), para (x,y) = ( 3, 3).d) Encontre as marginais de X e Y.e) Determine a E(X), E(Y), Var(X) e Var(Y)
65) Considere a função bivariada
fxy(x,y) = (x+y) 1(0, 1) (x) 1(0, 1) (y)
a) Mostre que esta função é uma densidade.b) Encontre a marginal de X e a marginal de Y.c) Calcule a média de X e a média de Y.d) Encontre a Var(x) e a Var(Y).
66) Sejam X e Y v.a.'s independentes, cada uma com distribuição exponencial de parâmetro 1. Provar
que (X + Y) e X também são independentes e achar as suas distribuições.y
67) As v.a.'s X e Y são independentes. X é distribuida exponencialmente com parâmetro a e Y é
distribuída exponencialmente com parâmetro ll. a) Encontre a distribuição de Z = ~ . b) Encontre a
distribuição de W = (X - Y).
68) Sejam X e Y v.a.'s i.i.d., cada uma com distribuição normal-padrão. a) Qual a distribuição de
Z = X? b) Qual a distribuição de X2? c) Prove que se as v.a.'s X e Y são i.i.d., então as v.a.'sY
U = (X - Y) e V = (X + Y) também são v.a. 's i.i.d. com distribuíção normal-padrão ..fi .fi
J
...I
.;
..J
,-
...•
EslatlsUca GemI Página nO 26
II
Jorge Festa
PAg/nano 21
,t
Estal/stica Gtm1I
Distribuições Discretas
• Uniforme ou Retangular1
f(x) = --1(, bJ(X); - 00 < a,b< 00b-a '• Normal
f(x) = ~exP[-(x-Il)2 /2cr2]I(~,OO)(x), -00 < Il < 00; cr > Ocr 21t
• Exponencialf(x) = 1£""1(0,00)(x); Â. > O
• Gamma ()~ /' ~ ;9, li,f(x) = ~x'-'e-""I(o 00) (x); Â. > O; r > O
r(r) ,• Beta
1 _f(x) = ---x' '(1- X)b-I 1(01) (x); a > O; b > O
B(a,b) ,• Cauchy
1f(x) = () 2 I(~ OO)(x);- 00 <a < 00; /3 > O
1t/3{1 + [ x - a 1/3]} ,
---....----------------------------------,-----Qc,c0,CCOO
/
OÇ7CCCO9e\J
~~.
CCJ
CçoçC
"ç.'Oo.~'ccCooocc.,;,oococCcocÔcobo
JorgeFesla
-------------------------~~-......c_Jo:>oooooO •ooQo'ooooooooooooooO'()
oO'ooooo-ooooaoo
• Lognormal12,
f(x) = v'27t exp[ -(logo x - Jl) /202 ]1(0.00) (lê); - 00 < Jl < 00; o > o~ 2x _• Dupla-exponencial
f(x) = 2~ exp( Jx ;al}(~.oo)(X); - 00 < a < 00; Ib O
• Weibullf(x) = abxb-1 exp[-axb]l(o.oo)(x); a> O; b > O
• LogisticaF(x) = [I + e-(x-aY~r! I(~.oo)(x); - 00 < a < 00; 13 > O
• Pareto ex.f(x) = x.+~ I(x•.00) (x); Xo> O; e > o
• Gumbel ou Valor extremoF(x) = exp( -e -(x-aY~)I(~;. 00) (x); - 00 <a < 00; 13 > O
• Distribuição t - Student" s
f(x)=1(k+I)/2] 1 I 1 (x), bOr(k / 2) JkiC (1 +x2 / k)(k+1Y2(~.oo) ,
• Distribuição Fr(m+n)/2] (m)m/2 x(m-2Y2 '._
f(x) = r(m/2)r(n/2) -; (1+(m/n)xt+n)/2 I(o.oo)(x),m, n -I, 2, ...
• Distribuição Qui-quadrado
_ I (I)'/2 Yz-! -(Yzl' . _ .f(x) - ( ) - x e 1(0 OO)(x),k -I, 2, ...r k/2 2 .
Estatlstica GetaI Página nO 28
.;'
. ~r: ! ~
-------------------_. --
r:
~ Análise Exploratória deDados
• CapItula J - Resuma de Dadas.Introdução• Tipos de Variáveis• Distribuição de Freqüências.Representação Gráfica dasVariáveis Quantitativas.Ramo-e- folhas
--~-----------------------------------;;,CCCc,coocéC-c"Óo~
9e~.o"0 ••çooocCQoocOQcooeOcoo"ooo(,oooooc
Estatística
GRANDES ÁREAS DA,ESTA TISTICA
• Amastrtlgem e planejamento de experimentos• coleção ou coleta de dados
• Estatística descritivrz• organização, apresentação e
sintetização de dados• Estatístico inferencial
• métodos para tomada de decisões, nassituações onde existem incertezas e \)1
- "r::VARIAÇOES. -:Z'f
5q c'
• lima estatística é uma quantidade que écalculada das dadas amastradas. Ela éusada para dar informações a respeito devalores desconhecidos da correspondentepopulaÇÍÍo. Por exemplo_ a.média dos dadosamostrados é utilizada para darinformaÇÍÍes sobre toda a média dapopulação da qual a amostra foi retirada~.j~
-/fl\'5" c fi •• _'_
INTRODUÇAO• o que é ESTATÍSTICA?
- É fundamental na análise de dadas provenientesde quaisquer processos onde existaVARIABIUDADE.
- Uso de informações na: coleção, apresentação,análise e tomada de decisões, paro solucionarproblemas.
sr; c'
oocooQootoo9COOOOO
~ClQ....•.I",.:CCoqcÔcC'/CCe"~"o,c9ev(;Ic(;';o
ºpocc
~---------------------------------------------------••••••••••
••••-•••• AMOSTRAGEM
••••
•••••••
•••
•••
••••
••••••••
••••
••••
-•••••••••
•••-••••••••
•••••-••••
-
• É o processo de escolha da amostro. É aparte inicial de qualquer estudo estatístico .Consiste na escolha criteriosa dos elementosa serem submetidos ao estudo.- Ex. Pesquisas sobre tendências de votação .
• escolha da amostro, redação do questionário,a entrevista, a codificação dos dados, aapuração dos resultados são ETAPASFUNDAMENTAIS deste tipo de pesquisa~~',(.. '.
5" '7 r',
~STATÍSTICA DESCRITIVA
• É D ptIrte mais conhecida. Quem vi (1 noticiário,na televisão ou nos jornais, sabe quõo freqüente éti uso de média, índices e gr;Jficos nas notícias.- Exemplo:• O INPC, Índice Nacional de Preços aoConsumidar- Aumenfl>dos produfl>sda cesta básica.
• Anuório EstatísticD Brasileiro- educaçQo, saúde, transporte,cultura etc.
SI! 'ç
6" Estatística Inferencial.A estatística Inferencial fazuso das informaçõesretiradas da amostra paraconclusões (inferências]. arespeito da população daqual a amostra foi retirada .
""' cp
A
INFERENCIA
APRESENTAÇÃO DEDADOS
• Técnicas que permitem detectar e carrigirerros e inconsistências ocorridos durante umprtH:esso de coleta de dados e determinaras principais características destes dados.- Grupamento de dados;- ConstruçQode distribuições de freqüência;-Gráficos. -:.~I~,.,
li\
• A temado de decisiies sobre a papulaçiio, cam basenas dados da amostra, canstifui o problema centrrllda INFERÊNCIA ESTATÍS77CA.
• A tais decisões estão sempre DssociadtlS um grtlude incerteza B. cDnseqüentemente, umap1Y1babilidade de erro.- Exemplo: Tute sabre medicamentas,experimentr1s agrícolas, antíJise financeif'Q,CDnsumo de energia etc.
r 1 C fi
sr: '13
üi POPULAÇAO E AMOSTRA• o utudo de t/UDlquer fenÔlnellD, sejo ele IIDfufY1l,stJeía£ eCDnâmico ou biDlógico, exige~tlcoleta eonálise de dodos estatísticos.- PD(JtJloçiioé o coleção de todos os obsertlflÇÕt!$sobre determinado fenÔlnellD.
- AIIIDS1TYJé o co'liunte de dodos efetivamenteobservados, ou extrrIfdos da papulaçiia.• Exemplo: Determinaçiio do consuma de áleadiuel em 6nibus, avaliaçiia de um program", d"./ensina, rendo média per capite em di •••rs~h •.;..
r: 7 rgregi6es do pt1ís etc. í1S'
\,)ccoeoocooo.oo~.
9eQOCOCCoc~oç;eocoooerÓooo"~-
oc"cooooti
Alturas em em. de 30 atlefllS
18\? 172 170 l\?I 189 In
184- 175 I\?2 177 178 179
170 1\?8 l\?g 170 18\? 188
189 l\?O 175 184- 1\?1 179
172 189 174- 171 I7\? 188
Li.a. U>o1~ I'<>nt" 7rwqiMnci. rr.qü ••.•"Lo J'Ewoqü"<1i<l.ea. •• Zn:tooriot ~d ••r NW1" ,.~oj;.. _tau... ,,~. -.1. ADUlO
Tipos de Variáveis• Qualittltivrl '
- Nominal• Regiãa de Pracedência
- Ordinal• Educaçãa, CltJSse Social
• Quantittltivrl- Discreta• Número de Filhos
- Contínua• Peso de Indivíduos, Salários em R$
r r C"
rI
1 15:2.000 15'7.000 lU ..5llO " ".133 "O.U.!:I 161.000 172.000 16"9.500 , IJ.~ 13 D•• .J.!.J 172.000 ln.OOO 174.500 11 11.261 2J 0.700• 177.000 1&'.000 179.5<'0 " IJ.zrJ(J Z1 o.~.$ llU.(l(IO 1i7.0llll J'4.500 J 0.100 30 1.000
~-=-~;;--~;;-;::~-:-~~;;;;-~-=-;;~-------\jl_....•: .•••...-i1,CP a '5 __
~ONSr.qUÇAÕ DE l!{STRIBUIÇÕESDEFREQUENCIA
61GRUPAMENTO DE DADOS
,-.,
'"'t;o(I(.I\)ooooti
-,..--------------------------------------------IQocococcovo•"oeoe-voCQoúoc(;)
oç,ooliCCo(;
Oooc
m
lI.tu•••
171 ,n 112
""",, .
//
//
111 172 In lU
GRÁFICOS
,u'"
, -•
,,
GRÁFICOS
•,~~.-"
GRÁFICOS
': I.I f7 !_
• i• l.• '.J ;-
z ;-1 i-• L_~__~ ~ ~~_~~_~ " ~_~ ~-\_/-
1S7 112 187 112 1n lU 111 1'Z" l /Muru "/:rf
,~til ,'_a'"~nnn
"•••
r r e"
;o; c fl
c;o; • "
'e"IQoço()ooco'"ºoo~cpe.vC~ç.coooo(;t
ocooooooQoooo(I
GCoocoooo{;
,GRAFICOS
o I 2 g 4 !
5 1 I 2 2 ,,
2 g g 2 2g 4 5 I 2
2 g 2 g 2
-o. soou O.~llO ,.~ , 0.0400 , 0,0400O.SOOU 1.~"O ,.~ • 0.1600 , O.:JOOOL!lOOO 2.!J(l1Ul 2.000 " 0.4000 " 0.60002.5000 3.5000 ,.~ • 0.2400 " 0,'4003.5000 4.5000 4.000 , 0.0800 ~ 0,':00( .3000 .5 . .5000 ,.~ , 0,01100 ~ 1.0000
Número de filhos em 25 fam/1ias observadas
1
to! C"
:Lime. "J.•a. p".,t<> r •.•qUlnct. rnqU.6ncJ.. , •.-.qUIno.l.C~ •• Zntu .•"r &\.!per.l".. HIicU" .-r.qJ'n<>Je •• !.oU... " ••••• l.odo "')."""'"
"
NÚInttrtJd~ filhDs em 25 faml1ias observados
sr; C fO
$" S7?
~ GRUPAMENTO DE DADOS
uU"" . CONSTRUÇAO DEDISTRIBUIÇÕES DE FREQÜÊNCIA
5oçcooçcoc
ºcoc
'",e.o9'c,cocoo~o"Go"oeo(Iooo\.7(,)\io(,)ccooooc
• Capítulo 2 - Algumas medidas associadasa variáveis Quantitativas.Medidas de Posição.Medidas de Dispersão.Outra Estratégia de Análise.Desenho Esquemático
GRÁFICOS
j' \
,'.---',
".
Poligono do F........."au
!
//.'
"•
Análise Exploratória deDados
CP e??
cr' 'r
'óQçC;Óoo'-cÕc.9o"(;tc.eo.oç
"coooúo~\)
Estatísticas Descritivas
cpO&OO-COOec~
oCOOOOOC\;
foi cu
Tamanho da AmostroMidiaMediana.ModaMédia GeométricaVoriônc;oDeswD-padrãoErrD-padrãoMínimoMáximo
AmplitudeQuarfil InferiorQuarlil SuperiorInterwllo Inter-quortilAssimetria ''$kewnwss''Assimetria PadronizadaCurlDse "KurtDSis"CurlDse PadronizadaCDe'ficiOlte de Variaç6À..j/-",SD",tltório 1'1$
121 Análise Exploratória de, Dados
• Ferramentas Principais-Ramo-e-folhas - ''Stem-and-Leaf'"-Esquema de cinco números - ''5-number summary"- Desenho Esquemático -
y = Xp + £
Estatística Clássica.5upDsições Probabilísticas das Variáveis En""Mdas.Declaroções sabre os Parâmetros ou ModeloUtilizado.Noções Assintáticas de
- Consistência- VDriâncía "Grandes AmostrosN
- Eficiência"11SE A ESTATÍSTICA COMO O BÊBADO liSA ,OS
POSTES - MAIS PELO APOIO QIIE PELA ~i/, IWMINAÇAÕ"/'!:::é'"'
••••••••"""iW'M_ Aná"r ' .•
r ( C 75
rI cu
st' 77'
121 Análise Exploratória deDados
• Tukey J. W. (1977)- Técnicas VisuaisDados = Modelo + ResíduosModelo = parte SuaveResíduos = parte Grosseira
QCCooco..•.C-oo9Ocec-oooçQC
"ocC1oç\,)c
"o'"oeeoeco
"e"~oooo
1
( £[)) o ; .te--Úr:.... &C.."....,."v-- nC'AAAO A :lirZd~
~
Ramo-e- folhas
Alturt1$ em em. de 30 atletas
RAMO-E-FOLHAS
u..t.. .I.J.a.le. ""'... ~=U ,..."... ••••ú ~ •••••••C:a.-_ 1~ ••.J. •• ,"" ~.... MioU..rr..q;;""...... "'laU... "'-Lo... "'l . .l_1 lU.OOO U7.""" 114.500 4 0.133 4 0.133•• 167,000 I72.000 IU.SOI) • 0.300 13 0.• "3 172.0"0 111.000 J74.IJQO • 0.".7 21 0.700• 111.000 162.""" 17'.500 , 0,2"0 27 O.SIO.,5 IU.o"a 187.000 u •• ~o 3 0.100 .!lo •. 000
~:-:-;;;~;;;---;,::;:-;:~:-:-;:-;;;~;----;.:;::-:-;;;~;-- .. ------------\..11-" ..,;,..(1S-
• ApresentaçãoRAMO - à esquerda da linha verticalFOLHAS - à direita da linha vertical
• Vantagem sobre a Tabela de Freqüência:- Não perdemos informação- Número de linhas é equivalente ao \ /número de classes ~l~
.[.t,'Frra?? __
slU In
co: en
t: CONSTRUÇAO DE>ISTRIBUIÇÕES DE FREQÜÊNCIA
[;occ.ooç.ccoooo'"oc~ooQCoc"o"oooocoooD- Di-..it.l ••• _ ...•-tc;iha. p••• .IL:nat&S; utúdol'" •• 1
C:.. 2 16r1/ ••••..•.'..v. ,-O4 16Bln
Il lO 16<>!8lIP.!t
i'-' V~,.Jo. ( .•.•Lyt.()13 17"10001
'-" • ~ (() P"UlJfoS'iV' Ij lJ~lor ~ ~:::;'
C~~cl,\:a..vo 11 n"ll!ll6 111'10113 lft'ln
~ I 10"1 ..., 1 18"16" ,O v-.~ê";...,-o
COO
'"OOCOO~,.
NÚ1ÍI£fYJ de f,'lhos em 25 fam/1;lls obserW1dos
J
RAMO-E-FOLHAS
Esquema ou Resumo de 5Números
1 ..0 •.500<1 0.5000 0.000 1 O.04C7<l 1 O.O.DO
Z 0 •.500<1 L5IUID 1,_ • 0.1600 .5 0.2000,li l..5OD<! Z.!KKJO 2.000 10 0.(1)00 15 0."_• 2 •.500<1 3 •.5000 3.000 6 0.2.00 21 O.UOO.5 3•.5000 ,.!j(/{J(I '.000 :I. O.Ollll" 23 0.9::«>" •• 5000 .5..50<:10 5._ Z 0.0800 25 1.0000
~:-:-;-:---~~:-;~;:-=-~-;.;;;;---=:;;:-:-;--------------------"Sli/!'\<~FI! eu __
.5 oo(IIIJסס11 210 __ 0
10 3100000C/
" .100
5[0[ 8 17
4úút.. L.I..Iioit.. _... '~ah. ~d.a ~"WClAoI_U>t'.,dor S<lperloz >MdJ•• n-p.-....J. ","utJ._ """"""-l..ta ,..1. ~
Sugestão (Tukey) - 1977
tbNSTRUÇAO DE '?{STRIBUIÇÕESDE FREQUENCIA
(i) ti mediano(ii) os extre111DS (mini"", e mDximo)(il'i) os quartis ou juntos (inferior e superior)
A Mediana é uma Medida Resistente,não é afetada por valores extremos.
.0 Média amostraI e (1 lJes.lio-padrão são afetados pDr•• IDres~mDS \ 1/enãD temos idéia quanto li simetria da distribuição dOS...da'dDS~
/f~O" cu (\
•,-\"ICCçoo~coc.occo"coococoúoooo
"cco'"~oo"occooco(j
oocç,oc
~o,~"':li)O->t hHt • I,;)J
l><n;i~t, (,O ,":lo) "O<>~I'er<;. = ~z.. ,"}<;
~61 12. 1-\ I~,
6í 1rLo ;r Ib 1 1\0
1~3 dJ = '2-i ( 1>0
'11~((c2.ilí\; ( .\\S":l. 9~cl = 10
_~ir;~üJ_E rMi" 1Jd.1 '\r "
fp.t ff.t I .:1....f :1??s[f' it;:. "'''$ -=-O;"\\íe<ç
1
o'."0 _•~.J
165 170 175 160 165.llu,. de .luno ••••• em
Exemplo
150 155 160
~.-"'".,
\0\,"cf
o'l:'
i"',, ) ':!Exemplo, ~ Desenho Esquernlltieo
p ",.~~>(, ,~_.".''0i -', \ 'f~~ ""'1.
150 155 160 165 170 175 180 185 190 195altunl de alunoa em em
Desenho Esquemático'VM DESENHO ESQVEMÁTICO OV
GRÁFICO DO ESQVEMA DE 5NÚMEROS VALE MAIS QVE 1000
PALAVRAS"Ol/TLIERS
eYtlIDrQ abaixDda Jl - 3/2 dJeYtlIDrU acima da J3 + 3/2 dJ, DndeJl = 10 quarfil, J3 = 30 quartil e dJ = J3 - Jl
r I e 7'
UI 8"
~oco"QoCcooooo"oooooo
"oooooooo~oooQCQoooccc(;(.)
ocou~
üI Variáveis Multidimensionais
üI Análise Exploratória deDados
.1
Suf!lJ!!.or2226
2"Gra51618
l'Grau435
12"
_'(LXCapitalInterioÃ
~).
• Em muitas situações observamos duasou mais característicassimultaneamente, para analisar o seucomportamento.
• A DISTRIBUIÇÃO CONJUNTA dasfreqüências será um poderosoinstrumento na compreensão dos dados;
~~l~trs-
" , 3S
• Capítulo 3 - Análise Bidimensianal• Variáveis Multidimensionais.Independência de Variáveis.Medidas de Dependência entreDuas Variáveis.Diagrama de Dispersão.Coeficiente de Correlação
c;o; ? n
Cri eu
LI -{-~ Distribuição conjunta..;'?
/./..--- /
lJistribuiçio. C"'CÍunfa do 6rau de Ins6vçQD e RegiDOy
'óc~
"occococoocCQoQCo'"oocooooco"úe"ç;occcÓcocccc(;cc
...
!JI Independência de Variáveis
!JI Independência de Variáveis
1
___ !lxl Ma~ulifl(J__ ~etT1ÍnÍ!1Q .. _ .7Jzf!1!..Econonia ' 85 (61%) 35 (58%) 120(60%)Mninisflação 55 (39%) 25 (42%) 80 (40%)Total 140 1OO%) 60 (100%) 200 (1OO~l
-'",.::;ç"-
tIS'Cid C l'
" •• c.tr'~')["-r.]''1:7 Cl,"}IJo.cl{ad.o, ~hJ,f" \ry"ko\Jo
• I/m dos principais objetivos de umadistribuição conjunta é descrever aASSOCIABILIDADE existente ENTREOI/AS VARIÁVEIS, isto é, que-.remosconhecer o GRAI/ DE DEPENDENCIAentreelas, de modo que possamos prever melhor oresultado de uma delas quando conhecemosa realização da outra. ~ll
C1:' S'9 --l-'Ir
. fw> (I,olkid..ln ....•.." ....\~ ~ e"I (A./1U J.:"I--,r. tv-~w-'
li' Medidas de Dependência . J <- ~. "-#__ ~y1~~I ~_----entre Duas Variáveis 0v,.p':.)e fH ,;J<\nt'"
• coeficientes de ossociação o..u'()'I''''~ "-(f-I~~;J---------------correlação Jfl~'" O-- +- ..•.,J.-~ _- coeficiente de contingência/e Kap/~PeorsDn tfJ tv vJfi O;(J! ~1 IV' ~ ~ (t, -ej' vYcJ ••- X =L..--- {'I' -----------------
i=1 ei .
ocvc-oooococo"ooooooouooooooQo(,)
'"ooccooc(;Jo"'"oocc'-'cc
JOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOO()
OOOOOOO
Á-<'r0kv ~c.: 1<..•
~ 'r-o l....,-e oJ k..~J-(v= : h 1
OCe ?,
( Oc c.-L-~ In: k, e..f-<' " \ ~-e..P..)(~ nJ...JO""OL •••••.• 'hodé,1. \~). ,V\.
i. 0, \ Z. _.' ,"'"o- = e;I
~ é.. ad..~ â. A;"'~ ~ ;t-cec.
~. -, ~ ..J fi /..".~Q ~; -r.-ú;;.a. _
;;:'..r~<A;!o
v t?r <h roti' u-e.t"'V> ( / 71;t-r I
Oeu...,-&-v 0-- i..,../io:.i"", I'~, j?,a~~",~~~,(., ..t:..•f""", ~~
01,,-,< C;. •••-<.e>~,p., ?~e~ .Me-b' ~./. t~-e. .JI' ~/O/¥e;; "'1.6r- ....;..,.,;-_"~korr-' o-. d~,-f." /'/""...,-.- ...v<,v'&" ~-t. /l-'~......(.
3: .e..-z&::0' n-C(ff M~'oI"",- (t4Ú;À /V-O/[A~-t.< 'de<c:ty /L-vQ ~"""'''' )
~L.c-i(o,-, e.) l. ~ ~ (J(d I~~)loo €; (tolv"",<_J.)'" (t;~~5-1.)
CP '('
1
-----
-'._- --'--170 110_.-
Gol o
.1.1 ..
~.1..
/ I ~ d- 5~é>'1IVI- yJ-o 1-",.P/o,0"-0 {(/v«~M/)(-'f ~'v..L't ú''''' _Diagralflas de Dispersa0
Y= A + Bx
"Lxy- LXLYB-~~~~~- "LX' -(Lx)'A Ly-BLx
""Lxy- LXLYr~~==~=~========J["LX' -(LX)']["LY' -(LY)']
II
CP C"
V Coeficiente de Correlação
o'"(,.,ecc"o""oooC,;vo
"ooooooooQQoCooQo"(..Jouootio
"(,Joov(,)(J(..Jf.;
1
J; • }d.p se./ 6 '1¥t~
1,3'1
flt 1t/::,o,(,R"A ~ Zó: o,9~'«\-ft- ~V •O,9g<JJ
.4 ri.,ia ""f~/ (Çtt'.tf,(;<t,:.
h'Ç"bidJ" 1,"1,ft=S-
f(-idr-."
(u"'ch: •..•.~ /;.,//;";',,/ /.1tICA! '/d0t..~. O ,1I',.()6f', ;
~=4.r •~ ~,.,• -' "'c;éJi
caso
":;>;,I""j., ~V\Ac.. fiJis/,r. rplof.!/Á~ICJ-,"('1o.-b/<'"D;",;I, FV~Jc!/(Y;,};'"\ -Jd\LJeç
M,. fatio';. E1, 3C
X(~, = Jt - Z,b+
Experimento
Probabilidades
Probabilidades
• Capítulo 4 - Probabilidades.Introdução.Algumas Propriedades.Probabilidade Condicional eIndependência• Teorema de Bayes
• Uma das principais ferramentas daestatística é a probabilidade, queteve seu início formal com a escolhade jogos no início do século XVlT.
• Para seu entendimento necessitamosde alguns conhecimentos BÁSICOSque seguem:
• É qualquer processo ou estudo decoletar dados re~eMntes, os quaisexibem variações em seus resultados,resultados estes desconhecidos de antemão.- Ex. Lançamento de um dado honesto eobservar a cad.a arremesso a face \J~
:.r sv~/tada paro cima. -:[!f
qt • 17
sr' Ire
,--------------------------------------------.f, \ l -lí.~) ..e:.'"' \ 'l"~""'ffi' e "<5 ,7( 6 /G / )'L€lZ/ ,ira
"" \"-C.(;..,(..;(.,;
'"e.,.,ç,e.,.,C;.:<.,;
"Co.JC;.;~t.ItiC'-íçCc,;.;C;.;etio<;c~
"c;;.;tJove(,;.;t.i<...'l.:C,,;;C;.;
"Vt)t,)t::~
;i
JoJoo()
oo():Jooo~------~b;:)ouooo;:),:)oo
€t 9U?,k oa;:)oo
'_'.~--OooooooCoao
'- __ .0oo()ooooo
:J;.; 1}:Soo~1.J"1- -:: 'l, <f l- y"?e,
:f., , ),)7)13
eis ~ J3' r, '"t,Hqv\ '2.
:Tv-{ ]".,. J \ ::.-o ~1"'1'2-=- -t)r1 'Z- oJ ,
~ 1\' . /''l»'" iU •.••..
r,} r" oi r- "I)' -.'Z. .
Ot0.~'(J =- Lérv"y'"" , ~~lÓ1'A" ~ 3
o0H;,() s,,('
O,')X
).,_;.~~ ?"l \l'", S"p.1,~~
-. -;."~~.,..
fv"'c-. /a;!ic:&' va/ver;fv"~. /..--p,-;!. !;'IIo !f'"lA.\/-;«
J"111._'1
1VI' cl,'O~
I (o;Ul'-'\Â)
I
_ .;,l
,?~
_.~ .-~-,.'"'---'
'" . I~,~~
------------------------------------------------
-
cr' :'2•••••••••
IJIEspaço AmostraI "Q"•o espaço amostraI ':O': é o conjunto
de todos os resultados passíveis,elementares e indivisíveis doexperimento, onde cada resultado éum evento simples.- Ex. Lançamento de um dado honeston = {fl, f2, f3, f4, f5. f6} \,j
"-:..' . ...:-,t, 5'
•••••••••••••
Evento• Um evento, indicado pelas letn:Js A, B, .. "1 é
ql/Qlquer subctmjunto do espaço amostraI ''n~- Exemplo 1: A ocorrência de face ímpar, no
lançamento de um dado honesto.!., " • "J • -' eventõ'A = {fI. f3. f5 r /
- Exemplo 2: A ocorrência de face par, nolançamento de um dado honesto.evento B = {f2, f4. f6} \ .I
~s:(".,o::h.,(h~"'" -l7• f
Cel-~"'." ' ...~f}.n.•~'2 ~
. "I' "" _
1
c,cI,e..
,.'~.\..'.'~"
...• --
fi' ,._.;. '-
.:,:'1
I ,~ I.t (;
D I•. r-I I. • () ,.., ,
Io ,J
l •..;~
{JL/Bt{r~,; t ~
.I\.
,.
sr' em
U'U" u-álgebra• Uma a-álgebra é uma classe de / "subçonjuntos .do. espaça. amostrat;-n, •satisfazendo os seguintes axiomas: .~.:'
,i"rr, ....". ~::,L'.INi)QEA .'
ü) Se A EA, então A EA
üi) Se A e B EA, então AuB EA.;.~C'.;' "
,. f C Sf ••. .
••••
•••••••••--
.J-
;ft" Qfx;.{)
I I
1
Q (,,:>4 )
1- ~ t,yi,:/t>,/ o c~4"'
"rr (7l d i1' 1 eX>~) o Q ()(:> t;)
í\)(?(>t,?L) E
l' r 'f.. >x >
-~'V ( "><:> +- < 'li. ) = .1 - 17 (li Sob x.)-.,')7 Cy,?-x.-)-p r:p (-x >1;)
P(ÜA,)=f'IA,)/-, /-,
-.Definição Clássicá.Definição Freqüentista.Definição Geométrica.Definição Axiomática
A, (i.I"W é, 4 f"'I A} '" 0. i '"j; i, j= " .2, .. ) e .I'e ~A, eA, enlão
(i) P(A) ~ o(ii) P(O) = 1
(iii) Se A,,~, "".é uma .w~qlle"cia de el'etllO.I" nmll/amellle exclll.~il'o.\' em
7' ''3
7' ''7
~efinição de Probabilidade
üI Definição Axiomática
f";"!*'oo(,)Vt.,;Ct.-o(,.;tJtJÓe"Co)oof;)~ó(.iti.oouo~tit-~o~()
Go(;,L,ÓCt-(;t.-e;,;
""u()(.;O\,..
oO'Oi01O:O,O!01OiOI• I
01- Io:Q!("', i'-f "oOO'01O:0,OOi-01
~ Probabilidade Condicional
1
._-
Teorema de Bayes
n
P[A] =L P[AIBj]'P[Bj]j~1
P[AIBk ].P[Bk]P[BkIA]=-n-----L P[AIBj ].P[Bj]j~1
r: s n
r: '56
r: 'n
p(AB]P( AIB] = P(B] se P(B] ) 0, destaforma
. P(AB] = p(B].p(AIB]= P(A]'P(BIA]'
~ Teorema da Probabilidade. Total
;;y-
I~C(;.;
tJCt;,(;Qtie,c..'£,t
'"'Cc£>~\)(;,.;
~
"o(;(.l
"£;oCc'oc,..c.J6'tiC.C.:e\;.It;
"CtGeo,tJou,\,)
6' Regra da Multiplicação
2
Independência
Variável Aleatória
(i) P[AB] = P[A]' P[B](ii) P[AIB] = P[A] se P[B] > O(iii) P[BIA] = P[B] se P[A] > O
p(AnBnC) = P(A)
P(BIA)p(qAnB)
r: S M
• Uma variável aleatória, indicadapor X. é uma funcãp com domínioo espaço amostrai e contradomínioo conjunto dos números Reais, talque, o evento [ X !{x J pertence acr-álgebra para todos os valoresde x que pertencem aos no.s \1/reais. ~;'T1'-
fd e fO t '~
'"ctrt,.,\;.;oec(Jõc.-
"o'"ocf)~c.-c;.:~(;(;t;
"Cti(..;
Qçcc"~Gt;C
"C'-'(,(;o(,ecÇ.i(.;c~c-
------------------------------r-
.lL
fio U /J, , U A7- : .0-:'~~}0Z~{}J{lk)v{H:~ ~ft-. J .
/\A: ;.o-Ao /'IA 1 ~ A.r\ A•••• A ~f\ A1.:.12f
Y e'o Me d.f {'e,M.""
~} ""'- 7'"'V:~S r' ><
Q~OOJ.0'JOOàO:J
oOOQOQOoºO()
oO
,....••••••••••
•••Função Distribuição
•...
••••••••••
••••
•••
•••
••••••••••••
•••••-•••••••••••••••••••••••••
•••••••••••
•••
• UmaFunçãoDistribuição, indicadaporF{x;' é uma função, com domínioosReais e contradomínioo intervalo [O,l},satisfazendo as seguintespropriedades:-F{x) é não decrescente;-F{x) é contínua à direita;-F(-ro} = Oe F(ro} = 1
Cid • "
Função DistribuiçãoAcumulada
• Dada a variável aleatória )(chamaremos de funçãodistribuição acumulada a função
F(x) =p(X <X), '\IxEiR\./-~..•.•-,/ ".
sr' ''7 t'\
üI O Conceito de VariávelAleatória Discreta
• Uma variável aleatória)( é ditadiscreta, se ela assume um númerofinito ou infinito enumerável .
.A função, indicada por p(xJ nóschamamos função de probabilidadeda variável aleatória discreta X. \ I
r: 'f?
2
J ' . x.-: 1:" ~!'"ll!-:...sl ~ ~I Ot ..•....••..••~.Q A\-~ /~ ""'\.
/' ~:"'c.~."t) ..••""'-:.........;o .•...r)"\;o.o. Co,~1l',ttJt) =? [x. U.) : r'?CA>c\.>).tJ = 3/.,
~ (~1"t? eX. $ ',\" ] ~ ?Oo \.),11\1 -= 3/..,(~ (10) : "P[~ ~ loj " t? [.n.1 :: 1.
::)-ooJ()
aoo8i
o!•••••• I
v,C)a0,üi- ,
Oo,,.., i
' ..i i
O,o°IoJaooooo;:)ooO'Oiooooooçooo
2
h .
i)f(x) > O
Jf(x)dx < 00
x
-00
00
ii) f f(x) dx= 1
i)p(x) > O
ii)LP(x) = 1
Função Densidade deProbabilidade
Fun;ão de Probabilidade
r f C "
sr! C 55
õI O Conceito de Variável. Aleatória Cbntínua
• Uma variável aleatária, indicadapor)(, é dita contínua, se existeuma função f(x). chamada funçãodensidade de probabilidade, talque:
2
Propriedades
.Se g(x) = aX + b,-E[g(x)} = E(aX + b) = o E(X) + b
.Se g(x) =[X -Wr ,-E[g(x)} = Vor(X)'--j) ~1AfY. .,{.t f
_~iL...---------------'Í'S
{L X p(x), discreta
E(x) = fi}f x f(x) dx, continua-'" \ll
~ilfr r , FI
5[0[ ''2
U Valor Esperado de umaV' Varióvel Aleatória• Daáa uma variável aleatória X chamamosvalor méáia ou esperança matemática áe Xao valor
U Valor Esperado de UmaV' Função de uma Variável
Aleatória X "g(X)"• Dada a variável aleatória )(chamamos esperança ou valoresperado da função g(x) ao valor:
oco ~.[g(X)]~.i~:;;~;;~~;,.~..;~-.-------------------------
,.-.-. -----------------------------------vCccecceccocC6cÇJc~c..
'"o""eCt~"ICCe"t..JoCc"Oe(;cc.o~eccCt;c£:0()C.(;
• Capítula 7 - Variáveis AleatóriasMultiáimensionais- Distribuição Co'liunta- Distribuiçiies Marginais e Conáicionais- Funçiies áe Variáveis Aleatórias- Co"".,"!n~ia áe ?uas Variáveis Aleattfria.çj- VarlDvels CDntmUQs ..-":";:~.~
.lh\r ; • V -"'''''''''''''''''''" _
2
• Weibull• Logística• Parefr>• Gumbel (Valor Extremo)• t-Stuáent's• F-SnedecDrs• Qui-quaáraáo• Normal Sivariaáa '!c / .
--',''''-li\'
Variáveis AleatóriasMultidimensionais
Alguns Modelos Contínuos
Alguns Modelos Discretos
• Uniforme Contínuo• Normol .• Exponerlciol.GaIn/1.8eto• Couchy• Lognormal• Dupla-exponencial
• Distrib,uição Llniforme Discreta• Distribuição Bernoulli• Distribuição Binomial• Distribuição Hipergeométrica• Distribuição Geométrica• Distribuição Binomial Negativa• Distribuição Poisson
5'! S zr
sr' c Z?
2
LJ
-f f(x, y)dx dy = 1
\/':-.;:1~,--?r.~
"
00 00
-00 -00
CC' C Ir
i)f(x) > O
Distribuição Conjunta• Em muitos experimentos, Q um mesmo ponto
amostraI (j),atrihuímos VO/Dre5 de duas DU maisWlritiveis aleatórias. V- -- Ex. Suponha que queremos estudar a . ~,.CDl1JPt'siçDD de faml1ias com .3 crianÇlls, qupntoDD sexo. f;/' r>".x = número de meninas:;',.J'J t' .~.
- -"7;-'" - •.• Y = 1(se far hamem) e O (se far mulher).z = no. de vezes que hauve IItIriaçãada sixal
~~/çh' c:W = número de meninas "[rf
üIFunção Densidade Conjunta
-----------------------...,..-(j wt;:ú"t~ qq <.oJ,P-,,/l6<-cf-o ,£( /"Voft:>('dO /1L~/Z'-..t ..-<;:>. ••••••
~4 lÁ otUa..-.
~) J/V t?-- •...•.e.;..L4'~ .J!
81Oi01OOOI()
Oaoooo
I
Oi~- \
OI
glO'o,..•.VIgloQQooaí01glooÇ)oQ
ooQoo,..,\J
oo
&
f(x) =
SV' '7'
Distribuições Marginais
L f(x,y) ~<O- ~'.~
ff(x,y) dy ..~:1t
~f.~1\
2
o <. OAI?
.)? )I: of =y
II .!-"~'r?
f(x,y)f(xIY) = f(y)
f( X, y) == f( X )f(y)
r: 'v ,"""",,-
V Distribuições Independentes
V Distribuições Condicionais
cfj~ooo9c9eúO::...'\i)C-oeoto)OoêoCoCoOoococ
..~
Cov(XY) = E[(X - E(X)(Y - E(Y)]
2
Covariância de duasvariáveis aleatórias
ReferênciasBibliográficas
Monlgomery, Douglas C. & Runger, George C. Appliedstabstícs and probab/lity for engineers. New York,Wiley, 1994.
Monlgomery, Douglas C., Introduction lo slalisficalqualilyconlrol. NewYOIk, Wiley, 1991.
Bussab, Wilton 0" Eslallslica Básica. 4.ed. São Paulo,1987
-1< PXY
(JXy ,= f....l Xy - f....l X f....l y
\1.£/frr: cn
r, a ec
51" e C;
1iI Coeficiente de Correlação. deXe Y
(XY)= Cov(X,Y)p, -JVar(X) Var(Y)