Transcript
  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    1

    Universidade Estcio de S

    Apostila de Noes de Estatstica

    Marcelo Abraho de Mattos

    2010

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    2

    NOES DE ESTATSTICA ................................................................................. 4

    1. ESTATSTICA ........................................................................................................................ 4 1.1. CONCEITO ..................................................................................................................... 4 1.2. DIVISO DA ESTATSTICA ........................................................................................... 4 1.3. POPULAO ................................................................................................................. 4 1.4. AMOSTRAGEM .............................................................................................................. 5 1.5. AMOSTRA ...................................................................................................................... 6 1.6. CENSO ........................................................................................................................... 6 1.7. FENMENOS ESTATSTICOS ..................................................................................... 6 1.8. CARACTERSTICAS ...................................................................................................... 7

    2. FASES DO TRABALHO ESTATSTICO ............................................................................... 9 2.1. DEFINIO DO PROBLEMA ........................................................................................ 9 2.2. DEFINIO DOS OBJETIVOS (GERAL E ESPECFICO) ............................................ 9 2.3. PLANEJAMENTO ......................................................................................................... 10 2.4. COLETA DOS DADOS................................................................................................. 10 2.5. CRTICA DOS DADOS................................................................................................. 12 2.6. APURAO (ARMAZENAMENTO) DOS DADOS ...................................................... 12 2.7. EXPOSIO OU APRESENTAO DOS DADOS .................................................... 12 2.8. ANLISE E INTERPRETAO DOS DADOS ............................................................ 13

    3. NORMAS PARA APRESENTAO TABULAR DOS DADOS ......................................... 13 3.1. INTRODUO ............................................................................................................. 13 3.2. SRIES ESTATSTICAS .............................................................................................. 13 Feijo ....................................................................................................................................... 16

    4. REPRESENTAO GRFICA ........................................................................................... 17 4.1. INTRODUO ............................................................................................................. 17 4.2. REQUISITOS FUNDAMENTAIS EM UM GRFICO: .................................................. 17 4.3. GRFICOS QUANTO A FORMA: ................................................................................ 17

    5. PRINCIPAIS TIPOS DE GRFICOS ................................................................................... 18 5.1. GRFICOS EM CURVAS OU EM LINHAS ................................................................. 18 5.2. GRFICOS EM COLUNAS .......................................................................................... 19 5.3. GRFICOS EM BARRAS............................................................................................. 20 5.4. GRFICO EM COLUNAS MLTIPLAS (AGRUPADAS) ............................................. 22 5.5. GRFICO EM BARRAS MLTIPLAS (AGRUPADAS) ................................................ 23 5.6. GRFICO EM SETORES............................................................................................. 24

    6. DISTRIBUIO DE FREQNCIAS .................................................................................. 25 6.1. INTRODUO ............................................................................................................. 25 6.2. DISTRIBUIO DE FREQNCIA PARA DADOS AGRUPADOS ............................ 25 6.3. REPRESENTAO DOS DADOS (AMOSTRAIS OU POPULACIONAIS) ................. 26

    7. ELEMENTOS DE UMA DISTRIBUIO DE FREQNCIA .............................................. 28 7.1. DETERMINAO DO NMERO DE CLASSES (K) ................................................... 28

    8. TIPOS DE FREQNCIAS ................................................................................................. 30 9. DISTRIBUIES CUMULATIVAS ...................................................................................... 31

    9.1. Freqncia absoluta acumulada (Fac) ......................................................................... 31 9.2. Freqncia relativa acumulada (Frac) .......................................................................... 31

    10. HISTOGRAMA E POLGONO DE FREQUNCIAS ........................................................ 32 10.1. HISTOGRAMAS ....................................................................................................... 32 10.2. POLGONO DE FREQUNCIAS ............................................................................. 33

    11. MEDIDAS DE POSIAO (MEDIDAS DE TENDNCIA CENTRAL) ............................... 33 11.1. Mdia aritmtica ....................................................................................................... 34

    (Dados sem classes): Determinar a mdia aritmtica da Tabela 5.4 .................................... 35 (Dados com classes): Determinar a mdia aritmtica da Tabela 5.7 .................................... 35

    11.2. Moda (Mo) ................................................................................................................ 37 11.3. Mediana (Md) ........................................................................................................... 40 11.4. Quartis (medidas separatrizes) ................................................................................ 42 11.5. Decis: dividem a srie em 10 partes iguais .............................................................. 43

    12. Medidas de disperso (Medidas de variabilidade) ...................................................... 44 12.1. Tipos de medidas de disperso ............................................................................... 44

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    3

    PRINCPIO FUNDAMENTAL DA CONTAGEM ................................................... 47 13. Permutaes ................................................................................................................... 49 14. Arranjos ........................................................................................................................... 52 15. Combinao .................................................................................................................... 52 16. Permutaes com elementos repetidos ...................................................................... 52

    INTRODUO PROBABILIDADE ................................................................... 54 17. Experimentos probabilsticos ....................................................................................... 54 18. Espao Amostral ............................................................................................................ 55 19. Retirada com e sem reposio ..................................................................................... 56 20. Evento .............................................................................................................................. 56 21. Evento impossvel .......................................................................................................... 56 22. Evento Elementar ........................................................................................................... 56 23. Evento certo .................................................................................................................... 56 24. Combinao de Eventos ................................................................................................ 56 25. Probabilidade de um Evento Elementar ...................................................................... 57

    PROBABILIDADE ............................................................................................... 58 26. Conceito .......................................................................................................................... 58 27. Probabilidade da Unio de Eventos (regra da adio) ............................................... 59 28. Probabilidade de No Ocorrer um Evento ................................................................... 60 29. Produto de Probabilidades (regra da multiplicao) .................................................. 61 30. Varivel Aleatria ........................................................................................................... 61 31. Valor esperado de uma varivel aleatria ................................................................... 62 32. Distribuio de probabilidade ....................................................................................... 63 33. Resumo das principais frmulas das probabilidades. ............................................... 65

    DISTRIBUIES DISCRETAS ............................................................................ 66 34. Distribuio Binomial .................................................................................................... 66

    34.1. Clculo das probabilidades ...................................................................................... 66 34.2. Esperana matemtica ............................................................................................. 66 34.3. Varincia ................................................................................................................... 66 34.4. Desvio padro .......................................................................................................... 67

    35. Distribuio de Bernoulli ............................................................................................... 67 35.1. Clculo das probabilidades ...................................................................................... 67 35.2. Esperana matemtica ............................................................................................. 67 35.3. Varincia ................................................................................................................... 67 35.4. Desvio padro .......................................................................................................... 67

    36. Distribuio de Poisson ................................................................................................ 67 36.1. Clculo das probabilidades ...................................................................................... 68 36.2. Esperana matemtica ............................................................................................. 68 36.3. Varincia ................................................................................................................... 68 36.4. Desvio padro .......................................................................................................... 68

    37. Distribuio Hipergeomtrica ....................................................................................... 68 37.1. Clculo das probabilidades ...................................................................................... 69 37.2. Esperana matemtica ............................................................................................. 69 37.3. Varincia ................................................................................................................... 69 37.4. Desvio padro .......................................................................................................... 69

    38. Aproximao da Binomial por Poisson ....................................................................... 69 DISTRIBUIO CONTNUA ................................................................................ 69

    39. Distribuio Normal ....................................................................................................... 69 40. Aproximao da Binomial pela Normal........................................................................ 71

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    4

    NOES DE ESTATSTICA

    1. ESTATSTICA 1.1. CONCEITO

    a cincia que se preocupa com a coleta, a organizao, descrio (apresentao), anlise e interpretao de dados experimentais e tem como objetivo fundamental o estudo de uma populao.

    Este estudo pode ser feito de duas maneiras:

    Investigando todos os elementos da populao.

    Por amostragem, ou seja, selecionando alguns elementos da populao.

    1.2. DIVISO DA ESTATSTICA

    - Estatstica Descritiva: aquela que se preocupa com a coleta,

    organizao, classificao, apresentao, interpretao e analise de dados referentes ao fenmeno atravs de grficos e tabelas alm de calcular medidas que permita descrever o fenmeno.

    - Estatstica Indutiva (Amostral ou Inferencial): a aquela que partindo

    de uma amostra, estabelece hipteses, tira concluses sobre a populao de origem e que formula previses fundamentando-se na teoria das probabilidades. A estatstica indutiva cuida da anlise e interpretao dos dados.

    O processo de generalizao do mtodo indutivo est associado a uma

    margem de incerteza. Isto se deve ao fato de que a concluso que se pretende obter para o conjunto de todos os indivduos analisados quanto a determinadas caractersticas comuns baseia-se em uma parcela do total de observaes.

    1.3. POPULAO

    CONCEITO: o conjunto, finito ou infinito, de indivduos ou objetos que

    apresentam em comum determinadas caractersticas definidas, cujo comportamento interessa analisar.

    A populao estudada em termos de observaes de caractersticas nos

    indivduos (animados ou inanimados) que sejam relevantes para o estudo, e no em termos de pessoas ou objetos em si. O objetivo tirar concluses sobre o fenmeno em estudo, a partir dos dados observados.

    Como em qualquer estudo estatstico temos em mente estudar uma ou

    mais caractersticas dos elementos de uma populao, importante definir bem essas caractersticas de interesse para que sejam delimitados os elementos que pertencem populao e quais os que no pertencem.

    Exemplos:

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    5

    a) Estudar os filhos tidos, tipo de moradia, condies de trabalho, tipo de sanitrio, nmeros de quartos para dormir, estado civil, uso da terra, tempo de trabalho, local de nascimento, tipo de cultivo etc, dos agricultores do Estado do Par.

    Populao: Todos os agricultores (proprietrios de terra ou no)

    plantadores das culturas existentes no Estado do Par.

    b) Estudar a precipitao pluviomtrica anual (em mm) na cidade de Belm.

    Populao: Conjunto das informaes coletadas pela Estao Pluviomtrica, durante o ano.

    c) As alturas dos cidados do Par constituem uma populao ou a

    populao dos pesos desses cidados.

    Diviso da populao - Populao Finita: apresenta um nmero limitado de elementos.

    possvel enumerar todos os elementos componentes. Exemplo:

    a) Idade dos universitrios do Estado do Par. Populao: Todos os universitrios do Estado do Par. - Populao Infinita: apresenta um nmero ilimitado de elementos. No

    possvel enumerar todos os elementos componentes. Entretanto, tal definio existe apenas no campo terico, uma vez que, na prtica, nunca encontraremos populaes com infinitos elementos, mas sim, populaes com grande nmero de componentes; e nessas circunstncias, tais populaes so tratadas como se fossem infinitas.

    Exemplos:

    a) Tipos de bactrias no corpo humano Populao: Todas as bactrias existentes no corpo humano.

    b) Comportamento das formigas de certa rea

    Populao: Todas as formigas da rea em estudo.

    1.4. AMOSTRAGEM

    a coleta das informaes de parte da populao, chamada amostra

    (representada por pela letra n), mediante mtodos adequados de seleo destas unidades.

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    6

    1.5. AMOSTRA

    uma parte (um subconjunto finito) representativa de uma populao selecionada segundo mtodos adequados.

    O objetivo fazer inferncias, tirar concluses sobre populaes com

    base nos resultados da amostra, para isso necessrio garantir que a amostra seja representativa, ou seja, a amostra deve conter as mesmas caractersticas bsicas da populao, no que diz respeito ao fenmeno que desejamos pesquisar.

    O termo induo um processo de raciocnio em que, partindo-se do

    conhecimento de uma parte, procura-se tirar concluses sobre a realidade no todo.

    Ao induzirmos estamos sujeitos a erros. Entretanto, a Estatstica Indutiva,

    que obtm resultados sobre populaes a partir das amostras, diz qual a preciso dos resultados e com que probabilidade se pode confiar nas concluses obtidas.

    1.6. CENSO

    o exame completo de toda populao. Quanto maior a amostra, mais precisa e confivel devero ser as indues

    feitas sobre a populao. Logo, os resultados mais perfeitos so obtidos pelo Censo. Na prtica, esta concluso muitas vezes no acontece, pois o emprego de amostras com certo rigor tcnico, pode levar a resultados mais confiveis ou at mesmo melhores do que os que seriam obtidos atravs de um Censo.

    As razes de se recorrer a amostras so: menor custo e tempo para

    levantar dados; melhor investigao dos elementos observados.

    1.7. FENMENOS ESTATSTICOS

    Refere-se a qualquer evento que se pretende analisar cujo estudo seja possvel de aplicao de tcnicas da estatstica.

    A Estatstica dedica-se ao estudo dos fenmenos de massa, que so

    resultantes do concurso de um grande nmero de causas, total ou parcialmente desconhecida.

    Tipos de fenmenos:

    a) Fenmenos Coletivos ou de Massa No podem ser definidos por uma simples observao. Exemplos: a natalidade, a mortalidade, a nupcialidade, a idade mdia dos

    agricultores do Estado do Par, o sexo dos agricultores.

    b) Fenmenos Individuais Compem os fenmenos coletivos.

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    7

    Exemplos: cada nascimento, cada pessoa que morre, cada agricultor

    investigado.

    1.8. CARACTERSTICAS preciso definir qual(is) a(s) caracterstica(s) de interesse que ser(o)

    analisada(s). A caracterstica de interesse pode ser de natureza qualitativa ou quantitativa.

    1.8.1. ATRIBUTOS: so todas as caractersticas de uma populao que

    no podem ser medidas. Os indivduos ou objetos so colocados em categorias ou tipos e conta-se

    a freqncia com que ocorrem.

    Exemplos: sexo (masculino e feminino); estado civil (solteiro, casado, vivo, etc.); tipo de moradia (madeira, tijolo), situao do aluno (aprovado, reprovado), religio.

    CLASSIFICAO DOS ATRIBUTOS

    a) Dicotomia: quando a classe em que o atributo considerado admite apenas duas categorias.

    Exemplos: Sexo (masc. e fem.); Existncia ou ausncia de certo produto

    agrcola (existncia, ausncia), resposta a uma pergunta: (concorda, no concorda), (sim, no).

    b) Policotomia: quando a classe em que o atributo considerado

    admite mais de duas categorias.

    Exemplos: Estado civil (solteiro, casado, vivo), classe social (alta, mdia ou baixa).

    1.8.2. VARIVEL: o conjunto de resultados possveis de um fenmeno

    (ou observao, ou caracterstica). Para os fenmenos: - sexo - dois resultados possveis: masculino e feminino; (no pode ser

    medida: um atributo) - nmero de filhos tidos de um grupo de casais - resultados possveis: 0, 1,

    2, 3, 4, 5, ..., n; - peso de pessoas adultas - resultados possveis: 60 kg, 59,3 kg, 75,3 kg,

    65,3 kg, ...; pode tomar um infinito nmero de valores num certo intervalo.

    TIPOS DE VARIVEIS

    a) Varivel Qualitativa: quando seus valores so expressos por atributos ou qualidade.

    Exemplos:

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    8

    Populao: Estudantes universitrios do Estado do Par. Variveis: sexo, profisso, escolaridade, religio, meio onde vivem (rural,

    urbano).

    Populao: Populao dos bairros perifricos do municpio de Belm.

    Variveis: tipo de casa, existncia de gua encanada (sim, no), bairro de

    origem.

    Variveis qualitativas que no so ordenveis recebem o nome de nominais.

    Exemplo: religio, sexo, raa, cor.

    Raa dos Paraenses - 2001

    Raa Freqncia

    Branca Negra Parda Outra

    Total

    Fonte: Fictcia

    Variveis qualitativas que so ordenveis recebem o nome de ordinais. Exemplo: nvel de instruo, classe social.

    Classe social dos Paraenses - 2001

    Classe social Freqncia

    Classe A Classe B Classe C Classe D

    Total

    Fonte: Fictcia

    b) Varivel Quantitativa: quando seus valores so expressos por nmeros. Esses nmeros podem ser obtidos por um processo de contagem ou medio.

    Exemplos:

    Populao: Todos os agricultores do Estado do Par.

    Variveis: nmero de filhos tidos, extenso da rea plantada, altura, idade.

    Populao: Populao dos bairros perifricos do municpio de Belm.

    Variveis: nmero de quartos, rea da casa em m2, nmero de moradores

    da casa.

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    9

    A varivel quantitativa divide-se em:

    a) Varivel Discreta: so aquelas que podem assumir apenas

    valores inteiros em pontos da reta real. possvel enumerar todos os possveis valores da varivel.

    Exemplos:

    Populao: Universitrios do Estado do Par. Variveis: nmero de filhos, nmero de quartos da casa, nmero de

    moradores, nmero de irmos.

    b) Varivel Contnua: so aquelas que podem assumir qualquer valor num certo intervalo (contnuo) da reta real. No possvel enumerar todos os possveis valores. Essas variveis, geralmente, provm de medies.

    Populao: Todos os agricultores do Estado do Par.

    Variveis: idade, renda familiar, extenso da rea plantada (em m2) , peso e altura das crianas agricultoras.

    2. FASES DO TRABALHO ESTATSTICO

    2.1. DEFINIO DO PROBLEMA

    A primeira fase do trabalho estatstico consiste em uma definio ou formulao correta do problema a ser estudado e a seguir escolher a natureza dos dados. Alm de considerar detidamente o problema objeto de estudo o analista dever examinar outros levantamentos realizados no mesmo campo e anlogos, uma vez que parte da informao de que necessita pode, muitas vezes, ser encontrada nesses ltimos. Saber exatamente aquilo que pretende pesquisar o mesmo que definir de maneira correta o problema.

    Por exemplo:

    a) os preos dos produtos agrcolas produzidos no Estado do Par so menores do que aqueles originados de outros Estados?

    b) qual a natureza e o grau de relao que existe entre a distribuio da pluviosidade e a colheita do produto x?

    c) estudar uma populao por sexo: dividi-se os dois grupos em masculino e feminino;

    2.2. DEFINIO DOS OBJETIVOS (GERAL E ESPECFICO)

    definir com exatido o que ser pesquisado. recomendvel ter em vista um objetivo para o estudo, em lugar de coletar o

    material e defini-lo no decorrer do trabalho ou s no fim deste.

    OBJETIVOS MAIS COMUNS EM UMA PESQUISA:

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    10

    Dados pessoais: grau de instruo, religio, nacionalidade, dados profissionais, familiares, econmicos, etc.

    Dados sobre comportamento: como se comportam segundo

    certas circunstncias. Ex: possvel remanejamento da rea habitada.

    Opinies, expectativas, nveis de informao, angstias,

    esperanas, aspiraes sobre certos assuntos.

    Dados sobre as condies habitacionais e de saneamento que avalie as condies em que vivem e a qualidade de vida de certo grupo.

    2.3. PLANEJAMENTO

    O problema est definido. Como resolv-lo? Se atravs de amostra, esta

    deve ser significativa para que represente a populao. O planejamento consiste em se determinar o procedimento necessrio

    para resolver o problema e, em especial, como levantar informaes sobre o assunto objeto de estudo. Quais dados devero ser coletados? Como se deve obt-los? preciso planejar o trabalho a ser realizado tendo em vista o objetivo que se pretende atingir.

    nesta fase que ser escolhido o tipo de levantamento a ser utilizado, que

    podem ser: a) levantamento censitrio, quando a contagem for completa, abrangendo

    todo o universo; b) levantamento por amostragem, quando a contagem for parcial. Outros elementos importantes que devem ser tratados nessa fase so o

    cronograma das atividades, atravs do qual so fixados os prazos para as vrias fases, os custos envolvidos, o exame das informaes disponveis, o delineamento da amostra, a forma como sero coletados os dados, os setores ou reas de investigao, o grau de preciso exigido e outros.

    2.4. COLETA DOS DADOS

    Refere-se obteno, reunio e registro sistemtico de dados, com o

    objetivo determinado. A escolha da fonte de obteno dos dados est diretamente relacionada

    ao tipo do problema, objetivos do trabalho, escala de atuao e disponibilidade de tempo e recursos.

    a) Fontes primrias: o levantamento direto no campo atravs de

    mensuraes diretas ou de entrevistas ou questionrios aplicados a sujeitos de interesse para a pesquisa.

    Vantagens: grau de detalhamento com respeito ao interesse dos quesitos

    levantados; maior preciso das informaes obtidas.

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    11

    b) Fontes secundrias: quando so publicados ou registrados por outra

    organizao. A coleta de dados secundrios se realiza atravs de documentos

    cartogrficos (mapas, cartas, imagens e fotografias obtidas por sensoriamento remoto ou por fotogrametria e imagens de radar). Estas fontes de informao so de extrema importncia.

    Das fotografias areas em escalas reduzidas ou mais detalhadas, das

    imagens de radar ou satlite e de cartas obtm-se informaes quanto ao uso do solo, drenagem, estruturas virias e urbanas, povoamento rural, recursos florsticos, minerais e pedolgicos, estrutura fundiria e de servios, dados altimtricos, etc.

    Vantagens: inclui um processo de reduo e agregao de informaes. A coleta dos dados pode ser feita de forma direta ou indireta.

    COLETA DIRETA A coleta dita direta quando so obtidos diretamente da fonte primria,

    como os levantamentos de campo atravs de questionrios.

    H trs tipos de coleta direta:

    a) a coleta contnua quando os dados so obtidos ininterruptamente, automaticamente e na vigncia de um determinado perodo: um ano, por exemplo. o caso dos registros de casamentos, bitos e nascimentos, escrita comercial, as construes civis.

    b) a coleta dos dados peridica quando feita em intervalos constantes de

    tempo, como o recenseamento demogrfico a cada dez anos e o censo industrial, anualmente.

    c) a coleta dos dados ocasional quando os dados forem colhidos

    esporadicamente, atendendo a uma conjuntura qualquer ou a uma emergncia, como por exemplo, um surto epidmico.

    COLETA INDIRETA A coleta dita indireta quando inferida a partir dos elementos

    conseguidos pela coleta direta, ou atravs do conhecimento de outros fenmenos que, de algum modo, estejam relacionados com o fenmeno em questo.

    Um instrumento por meio do qual se faz a coleta das unidades estatsticas

    o questionrio. Deve ficar bem claro no questionrio que ele organizado de acordo com dispositivos legais, que h sanses e que o sigilo sobre as informaes individuais ser absoluto.

    aconselhvel que um pequeno percentual dos exemplares do

    questionrio seja tirado e aplicado a uma parcela de informantes, a fim de testar a aceitao do mesmo, constituindo tal iniciativa, a pesquisa piloto. A boa aceitao

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    12

    dos questionrios determinar a tiragem completa dos exemplares ou a sua alterao.

    2.5. CRTICA DOS DADOS

    A crtica dos dados deve ser feita com cuidado atravs de um trabalho de

    reviso e correo, ao qual chamamos de crtica (consistncia), a fim de no de incorrer em erros que possam afetar de maneira sensvel os resultados.

    As perguntas dos questionrios uniformemente mal compreendidas, os

    enganos evidentes, tais como somas erradas, omisses, trocas de respostas e etc, so fceis de corrigir. necessrio, entretanto, que o crtico no faa a correo pr simples suposio sua, mas sim que tenha chegado a concluso absoluta do engano.

    As informaes relativas profisso no devem ser vagas como, pr exemplo:

    operrio, mas sim, oleiro, pedreiro, carpinteiro, etc., conforme o caso. O estado civil ser declarado: solteiro, casado, vivo ou desquitado. Em resumo, os dados devem sofrer uma crtica criteriosa com o objetivo de

    afastar os erros to comuns nessa natureza de trabalho. As informaes inexatas ou omissas devem ser corrigidas. Os questionrios devem voltar a fonte de origem sempre que se fizerem necessrio sua correo ou complementao.

    2.6. APURAO (ARMAZENAMENTO) DOS DADOS

    um processo de apurao ou sumarizao que consiste em resumir os

    dados atravs de sua contagem ou agrupamento. um trabalho de condensao e de tabulao dos dados, que chegam ao analista de forma desorganizada.

    Atravs da apurao, tem-se a oportunidade de condensar os dados, de modo

    a obter um conjunto compacto de nmeros, o qual possibilita distinguir melhor o comportamento do fenmeno na sua totalidade.

    Os dados de fenmenos geogrficos podem ser organizados em mapas,

    tabelas, matrizes, disquetes ou fitas.

    2.7. EXPOSIO OU APRESENTAO DOS DADOS

    H duas formas de apresentao que no se excluem mutuamente:

    Apresentao Tabular uma apresentao numrica dos dados. Consiste em dispor os dados em

    linhas e colunas distribudos de modo ordenado, segundo algumas regras prticas adotadas pelo Conselho Nacional de Estatstica. As tabelas tm a vantagem de conseguir expor, sistematicamente em um s local, os resultados sobre determinado assunto, de modo a se obter uma viso global mais rpida daquilo que se pretende analisar.

    Apresentao Grfica Constitui uma apresentao geomtrica dos dados. Permite ao analista obter

    uma viso to rpida, fcil e clara do fenmeno e sua variao.

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    13

    2.8. ANLISE E INTERPRETAO DOS DADOS

    Nessa etapa, o interesse maior consiste em tirar concluses que auxiliem o

    pesquisador a resolver seu problema. A anlise dos dados estatsticos est ligada essencialmente ao clculo de medidas, cuja finalidade principal descrever o fenmeno. Assim, o conjunto de dados a ser analisado pode ser expresso pr nmero-resumo, as estatsticas, que evidenciam caractersticas particulares desse conjunto.

    3. NORMAS PARA APRESENTAO TABULAR DOS DADOS

    3.1. INTRODUO

    A apresentao tabular uma apresentao numrica dos dados. Consiste em dispor os dados em linhas e colunas distribudos de modo ordenado, segundo algumas regras prticas ditadas pelo Conselho /nacional de Estatstica e pelo IBGE. Tais regras acham-se publicadas e dispem sobre os elementos essenciais e complementares da tabela, a especificao dos dados e dos sinais convencionais, o procedimento correto a ser desenvolvido no preenchimento da tabela e outros dispositivos importantes.

    As tabelas tm a vantagem de conseguir expor, sinteticamente e em um s

    local, os resultados sobre determinado assunto, de modo a se obter uma viso global mais rpida daquilo que se pretende analisar.

    Reunindo, pois os valores em tabelas compactas, consegue-se apresent-los

    e descrever-lhes a variao mais eficientemente. Essa condensao de valores permite ainda a utilizao de representao grfica, que normalmente uma forma mais til e elegante de apresentao da caracterstica analisada.

    3.2. SRIES ESTATSTICAS

    Um dos objetivos da Estatstica sintetizar os valores que uma ou mais

    variveis podem assumir, para que se tenha uma viso global dessa ou dessas variveis. Isto possvel apresentando esses valores em tabelas e grficos que fornecero rpidas e seguras informaes a respeito das variveis em estudo, permitindo determinaes mais coerentes.

    TABELA um quadro que resume um conjunto de observaes. Como construir uma tabela que fornea informaes de forma precisa e

    correta: 1 passo: Comear pelo ttulo, que explica o contedo da tabela. 2 passo: Fazer o corpo da tabela, composto pelos nmeros e informaes

    que ela contm. formada por linhas e colunas. Para compor o corpo da tabela, necessrio:

    O cabealho, que indica o que a coluna contm. Deve estar entre traos horizontais, para melhor visualizao.

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    14

    A coluna indicadora, que diz o que a linha contm. 3 passo: Escrever o total (as tabelas podem apresentar um total ou no).

    Aparece entre traos horizontais. 4 passo: Coloque a fonte. Deve entrar no rodap, sendo obrigatria. Uma tabela compe-se de: Tabela 3.1 Produo de Caf Brasil - 1978-1983

    Anos Quantidade (1000 ton)

    1978 (1) 2535 1979 2666 1980 2122 1981 3760 1982 2007 1983 2500

    Fonte: Fictcia Nota: Produo destinada para o consumo interno. (1) Parte exportada para a Argentina.

    Rodap: fonte, chamadas e notas.

    Notas: usada para conceituao ou esclarecimento em geral.

    Chamadas: usada para esclarecer certas mincias em relao a casas, linhas e colunas.

    De acordo com a Resoluo 886 da Fundao IBGE, nas casas ou clulas,

    devemos colocar:

    Um trao horizontal (___) quando o valor zero, no s quanto a natureza das coisas, como quanto ao resultado do inqurito;

    Trs pontos (...) quando no temos os dados;

    Um ponto de interrogao (?) quando temos dvida quanto a exatido de determinado valor;

    Zero (0) quando o valor muito pequeno para ser expresso pela unidade utilizada. Se os valores so expressos em numerais decimais, precisamos acrescentar a parte decimal um nmero correspondente de zeros (0,0; 0,00; 0,00;...).

    Denomina-se SRIE ESTATSTICA toda tabela que apresenta a distribuio

    de um conjunto de dados estatsticos em funo da POCA, do LOCAL, ou da ESPCIE (fenmeno).

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    15

    Numa srie estatstica observa-se a existncia de trs elementos ou fatores: o TEMPO, o ESPAO e a ESPCIE.

    Conforme varie um desses elementos, a srie estatstica classifica-se em

    TEMPORAL, GEOGRFICA e ESPECFICA.

    3.2.1. SRIE TEMPORAL, HISTRICA OU CRONOLGICA.

    a srie cujos dados esto em correspondncia com o tempo, ou seja, variam com o tempo.

    Tabela 3.2 Produo Brasileira de Trigo 1988-1993

    Anos Quantidade (1000 ton)

    1988 (1) 2345 1989 2451 1990 2501 1991 2204 1992 2306 1993 2560

    Fonte: IBGE Nota: Produo voltada para o consumo interno. (1) Parte da produo exportada.

    Elemento varivel: tempo (fator cronolgico) Elemento fixo: local e o fato

    3.2.2. SRIE GEOGRFICA, TERRITORIAL OU DE LOCALIDADE.

    a srie cujos dados esto em correspondncia com a regio geogrfica, ou

    seja, o elemento varivel o fator geogrfico (a regio).

    Tabela 3.3 Produo Brasileira de Trigo, por Unidade da Federao - 1994.

    Unidades da Federao Quantidade (1000 ton)

    So Paulo 670 Santa Catarina 451 Paran 550 Gois 420 Rio de Janeiro 306 Rio Grande do Sul 560

    Fonte: Fictcia Elemento varivel: localidade (fator geogrfico) Elemento fixo: tempo e o fato

    3.2.3. SRIE ESPECFICA OU CATEGRICA

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    16

    a srie cujos dados esto em correspondncia com a espcie, ou seja,

    variam com o fenmeno. Tabela 3.4 Rebanhos Brasileiros

    Espcie Quantidade

    (1000 cabeas)

    Bovinos 140 000 Sunos 1 181 Bubalinos 5 491 Coelhos 11 200

    Fonte: IBGE

    Elemento varivel: fenmeno (espcie) Elemento fixo: local e o tempo

    3.2.4. SRIES MISTAS

    As combinaes entre as sries anteriores constituem novas sries que so denominadas sries compostas ou mistas e so apresentadas em tabelas de dupla entrada.

    Tabela 3.5 Exportao Brasileira de alguns produtos agrcolas - 1990 - 1992

    Produto Quantidade (1000 ton)

    1990 1991 1992

    Feijo 5600 6200 7300 Arroz 8600 9600 10210 Soja 4000 5000 6000

    Fonte: Ministrio da Agricultura Nota: Produtos mais exportados no perodo.

    Este exemplo se constitui numa Srie Temporal-Especfica Elemento varivel: tempo e a espcie Elemento fixo: local

    Obs: uma tabela nem sempre representa uma srie estatstica, pode ser um aglomerado de informaes teis sobre certo assunto.

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    17

    Tabela 3.6 Situao dos espetculos cinematogrficos no Brasil - 1967

    Especificao Quantidade

    Nmero de cinemas 2.488 Lotao dos cinemas 1.722.348 Sesses pr dia 3.933 Filme de longa metragem 131.330.488 Meia entrada 89.581.234

    Fonte: Anurio Estatstico do Brasil - IBGE

    OBS:

    SRIE HOMGRADA

    A Srie homgrada aquela em que a varivel descrita apresenta variao discreta ou descontnua. So sries homgradas as sries temporal, a geogrfica e a especfica.

    SRIE HETERGRADA A srie hetergrada aquela na qual o fenmeno ou fato apresenta gradaes

    ou subdivises. Embora fixo, o fenmeno varia em intensidade. A distribuio de freqncias ou seriao uma srie hetergrada.

    4. REPRESENTAO GRFICA

    4.1. INTRODUO

    A Estatstica Descritiva pode descrever os dados atravs de grficos. A apresentao grfica um complemento importante da apresentao

    tabular. A vantagem de um grfico sobre a tabela est em possibilitar uma rpida impresso visual da distribuio dos valores ou das freqncias observadas. Os grficos propiciam uma idia inicial mais satisfatria da concentrao e disperso dos valores, uma vez que atravs deles os dados estatsticos se apresentam em termos de grandezas visualmente interpretveis.

    4.2. REQUISITOS FUNDAMENTAIS EM UM GRFICO:

    o Simplicidade: possibilitar a anlise rpida do fenmeno observado. Deve

    conter apenas o essencial. o Clareza: possibilitar a leitura e interpretaes correta dos valores do

    fenmeno. o Veracidade: deve expressar a verdade sobre o fenmeno observado.

    4.3. GRFICOS QUANTO A FORMA:

    o Diagramas: grficos geomtricos dispostos em duas dimenses. So mais

    usados na representao de sries estatsticas. o Cartogramas: a representao sobre uma carta geogrfica, sendo muito

    usado na Geografia, Histria e Demografia.

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    18

    o Estereogramas: representam volumes e so apresentados em trs dimenses.

    o Pictogramas: a representao grfica consta de figuras representativas do

    fenmeno. Desperta logo a ateno do pblico.

    5. PRINCIPAIS TIPOS DE GRFICOS

    5.1. GRFICOS EM CURVAS OU EM LINHAS

    So usados para representar sries temporais, principalmente quando a srie cobrir um grande nmero de perodos de tempo.

    Considere a srie temporal:

    Tabela 4.1 Produo de Arroz do Municpio X - 1984-1994

    Anos Quantidade (1000 ton)

    1984 816 1985 904 1986 1.203 1987 1.147 1988 1.239 1989 1.565 1990 1.620 1991 1.833 1992 1.910 1993 1.890 1994 1.903

    Fonte: Fictcia

    Grfico 4.1. Produo de Arroz do Municpio X - 1984-1994

    0

    500

    1000

    1500

    2000

    2500

    84 85 86 87 88 89 90 91 92 93 94

    (1000 ton)

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    19

    5.2. GRFICOS EM COLUNAS

    a representao de uma srie estatstica atravs de retngulos, dispostos

    em colunas (na vertical) ou em retngulos (na horizontal). Este tipo de grfico representa praticamente qualquer srie estatstica.

    As regras para a construo so as mesmas do grfico em curvas. As bases das colunas so iguais e as alturas so proporcionais aos

    respectivos dados. Exemplo: Tabela 4.2

    Produo de Soja do Municpio X - 1991-1995

    Anos Quantidade

    (ton.)

    1991 117.579 1992 148.550 1993 175.384 1994 220.272 1995 265.626

    Fonte: Secretaria Municipal de Agricultura

    Para cada ano construda uma coluna, variando a altura (proporcional a cada quantidade). As colunas so separadas uma das outras.

    Observao: O espao entre as colunas pode variar de 1/3 a 2/3 do tamanho

    da base da coluna.

    0

    50000

    100000

    150000

    200000

    250000

    300000

    To

    ne

    lad

    as

    1991 1992 1993 1994 1995

    Grfico 4.2. Produo de Soja do Municpio X - 1991-1995

    Uso do grfico em colunas para representar outras sries estatsticas

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    20

    Tabela 4.3 reas (Km2) das Regies Fisiogrficas - Brasil - 1966

    Regies Fisiogrficas rea (Km2)

    Norte 3.581.180 Nordeste 965.652 Sudeste 1.260.057 Sul 825.621 Centro-oeste 1.879.965

    Brasil 8.511.965

    Fonte: IBGE.

    0

    500.000

    1.000.000

    1.500.000

    2.000.000

    2.500.000

    3.000.000

    3.500.000

    4.000.000Km2

    Norte Nordeste Sudeste Sul Centro-Oeste

    Grafico 4.3. reas (Km2) das Regies Fisiogrficas - Brasil - 1966.

    Obs: Na tabela as regies so apresentadas em ordem geogrficas. No grfico as colunas so ordenadas pela altura, da maior para a menor, da esquerda para a direita.

    5.3. GRFICOS EM BARRAS

    As alturas dos retngulos so iguais e arbitrrias e os comprimentos so

    proporcionais aos respectivos dados. As barras devem ser separadas uma das outras pelo mesmo espao de forma

    que as inscries identifiquem as diferentes barras. O espao entre as barras pode ser a metade () ou dois teros(2/3) de suas larguras.

    As barras devem ser colocadas em ordem de grandeza de forma decrescente

    para facilitar a comparao dos valores. A categoria outros (quando existir) representada na barra inferior, mesmo que o seu comprimento exceda o de alguma outra.

    Outra representao grfica da Tabela 4.3:

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    21

    0

    500.

    000

    1.00

    0.00

    0

    1.50

    0.00

    0

    2.00

    0.00

    0

    2.50

    0.00

    0

    3.00

    0.00

    0

    3.50

    0.00

    0

    4.00

    0.00

    0

    Km2

    Norte

    Centro-Oeste

    Sudeste

    Nordeste

    Sul

    Grafico 4.4. reas (Km2) das Regies Fisiogrficas - Brasil - 1966.

    Tabela 4.4

    Matrcula efetiva no Ensino Superior, segundo os ramos de ensino -Brasil 1995

    Ramos de ensino Matrculas

    Filosofia, Cincias e Letras 44.802 Direito 36.363 Engenharia 26.603 Administrao e Economia 24.027 Medicina 17.152 Odontologia 6.794 Agricultura 4.852 Servio Social 3.121 Arquitetura e Urbanismo 2.774 Farmcia 2.619 Demais ramos 11.002

    Total 180.109

    Fonte: Fictcia

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    22

    050

    0010

    000

    1500

    020

    000

    2500

    030

    000

    3500

    040

    000

    4500

    0

    Matrculas

    Filosofia, Cincias e Letras

    Direito

    Engenharia

    Administrao e Econmia

    Medicina

    Odontologia

    Agricultura

    Servio Social

    Arquitetura e Urbanismo

    Farmcia

    Demais ramos

    Grafico 4.5. Matrcula efetiva no Ensino Superior, segundo os ramos de ensino - Brasil -

    1999.

    OBS: Quando a varivel em estudo for qualitativa e os nomes das categorias

    for extenso ou as sries forem geogrficas ou especficas prefervel o grfico em barras, devido a dificuldade em se escrever a legenda em baixo da coluna.

    5.4. GRFICO EM COLUNAS MLTIPLAS (AGRUPADAS)

    um tipo de grfico til para estabelecer comparaes entre as grandezas de

    cada categoria dos fenmenos estudados. A modalidade de apresentao das colunas chamada de Grfico de Colunas

    Remontadas. Ele proporciona economia de espaos sendo mais indicado quando a srie apresenta um nmero significativo de categorias.

    Exemplo: Tabela 4.5

    Entrada de migrantes em trs Estados do Brasil - 1992-1994

    Nmero de migrantes

    Anos

    Total Estados

    Amap So Paulo Paran

    1992 4.526 2.291 1.626 609 1993 4.633 2.456 1.585 592 1994 4.450 2.353 1.389 708

    Fonte: Fictcia

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    23

    0

    500

    1000

    1500

    2000

    2500Q

    uan

    tid

    ad

    e

    1992 1993 1994

    Grfico 4.6. Entrada de migrantes em trs Estados do Brasil

    1992-1994.

    Amap So Paulo Paran

    5.5. GRFICO EM BARRAS MLTIPLAS (AGRUPADAS)

    til quando a varivel for qualitativa ou os dizeres das categorias a serem escritos so extensos.

    Exemplo: Tabela 4.6 Importao Brasileira de vinho e champanhe proveniente de vrias

    origens - 1994

    Pases

    Importao (1.000 dlares)

    Vinho Champanhe

    Portugal 220 15 Itlia 175 25 Frana 230 90 Argentina 50 5 Chile 75 20 Espanha 110 16

    Fonte: Fictcia

    0 50 100 150 200 250

    1000 dlares

    Frana

    Portugal

    Itlia

    Espanha

    Chile

    Argentina

    Grfico 4.7. Importao Brasileira de vinho e champanhe proveniente de vrias origens -

    1994.

    Vinho Champanhe

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    24

    5.6. GRFICO EM SETORES

    a representao grfica de uma srie estatstica em um crculo de raio qualquer, pr meio de setores com ngulos centrais proporcionais s ocorrncias.

    utilizado quando se pretende comparar cada valor da srie com o total.

    O total da srie corresponde a 360 (total de graus de um arco de circunferncia).

    O grfico em setores representa valores absolutos ou porcentagens complementares.

    As sries geogrficas, especficas e as categorias em nvel nominal so mais representadas em grficos de setores, desde que no apresentem muitas parcelas (no mximo sete).

    Cada parcela componente do total ser expressa em graus, calculada atravs de uma regra de trs:

    Total - 360

    Parte - x

    Exemplo:

    Tabela 4.7 Produo Agrcola do Estado A - 1995

    Produtos Quantidade (t)

    Caf 400.000 Acar 200.000 Milho 100.000 Feijo 20.000

    Total 720.000

    Fonte: Fictcia

    Grfico 4.8. Produo Agrcola do Estado A - 1995.

    Caf

    55%Aucar

    28%

    Milho

    14%

    Feijo

    3%

    Outras maneiras de representar graficamente a Tabela 4.7:

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    25

    0

    50.000

    100.000

    150.000

    200.000

    250.000

    300.000

    350.000

    400.000

    Quantidade (t)

    Caf Aucar Milho Feijo

    Grfico 4.9. Produo Agrcola do Estado A - 1995.

    0

    50.0

    00

    100.

    000

    150.

    000

    200.

    000

    250.

    000

    300.

    000

    350.

    000

    400.

    000

    Quantidade (t)

    Caf

    Aucar

    Milho

    Feijo

    Grfico 4.10. Produo Agrcola do Estado A - 1995.

    6. DISTRIBUIO DE FREQNCIAS

    6.1. INTRODUO

    As tabelas estatsticas, geralmente, condensam informaes de fenmenos

    que necessitam da coleta de grande quantidade de dados numricos. No caso das distribuies de freqncias que um tipo de srie estatstica, os dados referentes ao fenmeno objeto de estudo se repetem na maioria das vezes sugerindo a apresentao em tabela onde apaream valores distintos um dos outros.

    6.2. DISTRIBUIO DE FREQNCIA PARA DADOS AGRUPADOS

    a srie estatstica que condensa um conjunto de dados conforme as

    freqncias ou repeties de seus valores. Os dados encontram-se dispostos em classes ou categorias junto com as freqncias correspondentes. Os elementos poca, local e fenmeno so fixos. O fenmeno apresenta-se atravs de gradaes, ou seja, os dados esto agrupados de acordo com a intensidade ou variao quantitativa gradual do fenmeno.

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    26

    6.3. REPRESENTAO DOS DADOS (AMOSTRAIS OU POPULACIONAIS)

    o Dados brutos: so aqueles que no foram numericamente organizados, ou seja, esto na forma com que foram coletados.

    Tabela 5.1 - Nmero de filhos de um grupo de 50 casais

    2 3 0 2 1 1 1 3 2 5 6 1 1 4 0 1 5 6 0 2 1 4 1 3 1 7 6 2 0 1 3 1 3 5 7 1 3 1 1 0 3 0 4 1 2 2 1 2 3 2

    o Rol: a organizao dos dados brutos em ordem de grandeza crescente ou decrescente.

    Tabela 5.2 - Nmero de filhos de um grupo de 50 casais

    o Distribuio de freqncias: a disposio dos valores com as respectivas

    freqncias. O nmero de observaes ou repeties de um valor ou de uma modalidade, em um levantamento qualquer, chamado freqncia desse valor ou dessa modalidade. Uma tabela de freqncias uma tabela onde se procura fazer corresponder os valores observados da varivel em estudo e as respectivas freqncias.

    a) Distribuio de freqncias para varivel discreta

    Os dados no so agrupados em classes.

    Tabela 5.3 - Nmero de filhos de um grupo de 50 casais

    Nmero de filhos (x i) Contagem ou tabulao

    Nmero de casais (f i)

    Total ( )

    0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 4 4 4 5 5 5 6 6 6 7 7

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    27

    Tabela 5.4 - Nmero de filhos de um grupo de 50 casais

    Nmero de filhos (x i)

    Numero de casais (f i)

    Total ( )

    Obs: X: representa a varivel Nmero de filhos. xi: representa os valores que a varivel assume. fi: o nmero de vezes que cada valor aparece no conjunto de dados (freqncia simples absoluta).

    fi = 50 n: tamanho da amostra (ou n de elementos observados). N: tamanho da populao (ou n de elementos observados).

    b) Distribuio de freqncias para varivel contnua Os dados da varivel so agrupados em classe (grupo de valores).

    Dados brutos Tabela 5.5 - Taxas municipais de urbanizao (em percentual) no Estado de Alagoas - 1970

    8 24 46 13 38 54 44 20 17 14 18 15 30 24 20 8 24 18 9 10 38 79 15 62 23 13 62 18 8 22 11 17 9 35 23 22 37 36 8 13 10 6 92 16 15 23 37 36 8 13 44 17 9 30 26 18 37 43 14 9 28 41 42 35 35 42 71 50 52 17 19 7 28 23 29 29 58 77 72 34 12 40 25 7 32 34 22 7 44 15 9 16 31 30

    Rol Tabela 5.6 - Rol das taxas municipais de urbanizao, no Estado de Alagoas (em %) - 1970.

    6 6 7 7 7 8 8 8 8 9 9 9 9 9 10 10 11 12 13 13 13 13 14 14 14 15 15 15 15 16 16 17 17 17 17 18 18 18 18 19 20 20 22 22 22 23 23 23 23 24 24 24 25 26 28 28 29 29 30 30 30 31 32 34 34 34 35 35 35 36

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    28

    37 37 38 38 40 41 42 42 43 44 44 44 46 50 52 54 58 62 62 71 72 77 79 92

    Distribuio de freqncias para dados agrupados em classes Tabela 5.7 - Taxas municipais de urbanizao, no Estado de Alagoas (em %) - 1970.

    Taxas (em %)

    Nmero de Municpios ( f i )

    6 ---| 16 29 16 ---| 26 24 26 ---| 36 16 36 ---| 46 13 46 ---| 56 4 56 ---| 66 3 66 ---| 76 2 76 ---| 86 2 86 ---| 96 1

    Total ( ) 94

    Obs:

    f i: freqncia simples absoluta.

    2. f i = n = 94.

    Quando a varivel, objeto de estudo for contnua, recomenda-se agrupar os valores observados em classes. Se a varivel for discreta e o nmero de valores observados for muito grande recomenda-se agrupar os dados em classes, evitando-se, com isso, grande extenso da tabela e a no interpretao dos valores de fenmeno.

    7. ELEMENTOS DE UMA DISTRIBUIO DE FREQNCIA

    o Amplitude total (AT): a diferena entre o maior e o menor valor observado.

    o Freqncia simples absoluta (fi): o nmero de vezes que o elemento aparece na amostra, ou o nmero de elementos pertencentes a uma classe (grupo de valores).

    o Classe (K): cada um dos grupos de valores do conjunto de valores observados,

    ou seja, so os intervalos de variao da varivel.

    7.1. DETERMINAO DO NMERO DE CLASSES (K)

    importante que a distribuio conte com um nmero adequado de classes. Se o nmero de classes for excessivamente pequeno acarretar perda de detalhe e pouca informao se poder extrair da tabela. Pr outro lado, se forem utilizadas um nmero excessivo de classes, haver alguma classe com freqncia nula ou muito pequena, no atingindo o objetivo de classificao que tornar o conjunto de dados supervisionveis.

    Frmula de Sturges:

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    29

    K 1 + 3,3. Log n

    o Intervalo de classe ou amplitude do intervalo de classe (i): o comprimento da

    classe.

    i A T/ K Obs: - Convm arredondar o nmero correspondente amplitude do intervalo

    de classe para facilitar os clculos (arredondamento arbitrrio). - Intervalo de classe: i = l s - l i

    o Limites de classes (limite inferior e limite superior): so os valores extremos de

    cada classes.

    Seja a classe 6 16 - limite inferior ( l i ) = 6 e limite superior ( l s ) = 16. Os valores 6 e 96, que representam, respectivamente, o limite inferior da 1

    classe e o limite superior da ltima classe, so denominados tambm limite inferior e limite superior da distribuio de freqncia.

    recomendvel que os limites de classes sejam representados por nmeros

    inteiros. Deve-se ter o cuidado para evitar interpretaes ambguas. Por exemplo: 30 _____ 40 40 _____ 50 50 _____ 60 O correto : 30 _____ 39 40 _____ 49 50 _____ 59

    Caso os valores estiveram arredondados para inteiro. Entretanto, se os valores originais estiverem com preciso at centavos:

    30,00 ____ 39,99 40,00 ____ 49,99 50,00 ____ 59,99 Em virtude de ordem esttica, recomenda-se: 30 ------| 40 40 ------| 50 50 ------| 60

    Limites reais Dizemos que os limites indicados em cada linha de uma tabela de distribuio

    de freqncias so os limites reais quando o limite superior de cada classe coincide com o limite inferior da classe seguinte.

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    30

    Veja o exemplo da Tabela 5.7, os limites so reais, cada limite superior de

    uma classe coincide com o limite inferior da classe seguinte. Vale observar que o uso do smbolo ---- s possvel com os limites reais de

    classe.

    o Ponto mdio das classes ( x i ): o valor representativo da classe para efeito de

    clculo de certas medidas. Para qualquer representao tabular basta acrescentar ao seu limite inferior a metade da amplitude do intervalo de classe.

    x i = i / 2 + l i

    Exemplo: 6 16, i = 10 metade de i = 10/2 = 5 x i = 5 + 6 = 11

    Quando o limite superior de uma classe for igual ao inferior da seguinte, o intervalo de classe poder ser calculado atravs da mdia aritmtica dos limites do intervalo.

    Exemplo: 6 16 : x i = (6 + 16)/2 = 11

    Para obter os pontos mdios das classes seguinte, basta acrescentar ao ponto mdio da classe precedente a amplitude do intervalo de classe (se for constante).

    8. TIPOS DE FREQNCIAS

    o Freqncia simples absoluta (f i): o nmero de repeties de um valor individual ou de uma classe de valores da varivel.

    f i = n

    o Freqncia simples relativa (f r): representa a proporo de observaes de um valor individual ou de uma classe em relao ao nmero total de observaes. Para calcular a freqncia relativa basta dividir a freqncia absoluta da classe ou do valor individual pelo nmero total de observaes. um valor importante para comparaes.

    f r = f i / n = f i / f i

    Para expressar o resultado em termos percentuais, multiplica-se o quociente obtido por 100.

    f r = (f i / n). 100

    A freqncia relativa o resultado de uma regra de trs simples: n ------- 100% Exemplo: 94 ------ 100% f i ------- x% 29 ------ x% x = 30,9 % Obs:

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    31

    - a soma das freqncias simples relativa de uma tabela de freqncia

    sempre igual a 1,00: f r = 1,00. - a soma das freqncias relativas percentuais de uma tabela de

    freqncia sempre igual a 100%: f r = 100%. 9. DISTRIBUIES CUMULATIVAS

    9.1. Freqncia absoluta acumulada (Fac)

    a soma da freqncia simples absoluta da classe atual com a(s) da(s) classe(s) anterior(es).

    9.2. Freqncia relativa acumulada (Frac)

    A freqncia relativa acumulada de uma classe ou do valor individual i igual

    a soma da freqncia simples relativa da classe ou do valor individual com as freqncias simples relativas das classes ou dos valores anteriores. As freqncias relativas acumuladas podem ser obtidas de duas formas:

    1. Acumulando as freqncias simples relativas de acordo com a definio de

    freqncias acumuladas. 2. Calculando as freqncias relativas diretamente a partir das freqncias

    absolutas de acordo com a definio de freqncias relativas: F r = F i / n

    Exemplos:

    1 ) Considere a varivel nmero de filhos do sexo masculino de 34 famlias com 4 filhos cada uma.

    0 2 3 4

    0 2 3 4

    1 2 3 4

    1 2 3 4

    1 2 3

    1 2 3

    1 2 3

    1 2 3

    2 3 3

    2 3 3

    Distribuio de freqncia sem classes por se tratar de uma Varivel Discreta. Tabela 1- Nmero de filhos do sexo masculino de 34 famlias com 4 filhos cada uma.

    Nmero meninos

    (x i)

    Nmero de

    famlia (f i)

    fr

    Fac

    fr %

    Frac

    Frac%

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    32

    0 1 2 3 4

    Total ( )

    2 ) Considere a estatura (em cm) de 40 alunos do Colgio B.

    150 156 161 164

    151 156 161 165

    152 157 161 166

    153 158 161 167

    154 158 162 168

    155 160 162 168

    155 160 163 169

    155 160 163 170

    155 160 164 172

    156 160 164 173

    Distribuio de freqncias com classes por se tratar de uma Varivel Continua.

    Tabela 2- Estatura (em cm) de 40 alunos do Colgio B.

    Estatura (em cm)

    Nmero de alunos

    (f i)

    fr

    Fac

    fr %

    Frac

    Frac%

    150 |154 154 | 158 158 | 162 162 | 166 166 | 170

    170 |174

    4 9

    11 8 5 3

    Total ( ) 40 10. HISTOGRAMA E POLGONO DE FREQUNCIAS

    10.1. HISTOGRAMAS

    So grficos de superfcies utilizados para representar distribuies de freqncias com dados agrupados em classes.

    O histograma composto por retngulos (denominados clulas), cada um deles representando um conjunto de valores prximos (as classes).

    A largura da base de cada clula deve ser proporcional amplitude do intervalo da classe que ela representa e a rea de cada clula deve ser proporcional freqncia da mesma classe.

    Se todas as classes tiverem igual amplitude, ento as alturas dos retngulos sero proporcionais s freqncias das classes que eles representam.

    Considere o histograma obtido a partir da Tabela 2:

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    33

    Tabela 2 - Taxas municipais de urbanizao, no Estado de Alagoas (em %) - 1970.

    Taxas (em %)

    Nmero de Municpios (f i)

    Percentual

    6 ---| 16 29 30,9 16 ---| 26 24 25,5 26 ---| 36 16 17,0 36 ---| 46 13 13,8 46 ---| 56 4 4,3 56 ---| 66 3 3,2 66 ---| 76 2 2,1 76 ---| 86 2 2,1 86 ---| 96 1 1,1

    Total ( ) 94 100,0

    10.2. POLGONO DE FREQUNCIAS

    O polgono de freqncias o grfico que obtemos unindo pontos dos lados superiores dos retngulos de um histograma por meio de segmentos de reta consecutivos.

    Na Tabela 5.7, temos: Tabela 5.7 - Taxas municipais de urbanizao, no Estado de Alagoas (em %) - 1970.

    Taxas (em %)

    Nmero de Municpios (f i)

    Percentual

    6 ---| 16 29 30,9

    16 ---| 26 24 25,5

    26 ---| 36 16 17,0

    36 ---| 46 13 13,8

    46 ---| 56 4 4,3

    56 ---| 66 3 3,2

    66 ---| 76 2 2,1

    76 ---| 86 2 2,1

    86 ---| 96 1 1,1

    Total ( ) 94 100,0

    11. MEDIDAS DE POSIAO (MEDIDAS DE TENDNCIA CENTRAL)

    As distribuies de freqncias para variveis discretas e contnuas descrevem os grupos que uma varivel pode assumir. possvel visualizar a concentrao de valores de uma distribuio de freqncias. Localizam-se no incio, no meio ou no final, ou se distribuem de forma igual.

    As medidas de posio so nmeros que resumem e representam caractersticas importantes da distribuio de freqncias e podem apresentar-se de vrias formas, dependendo daquilo que se pretende conhecer a respeito dos dados.

    As medidas de posio so chamadas de medidas de tendncia central, devido tendncia de os dados observados se concentrarem em torno desses valores centrais que se localizam em torno do meio ou centro de uma distribuio.

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    34

    As medidas (nmero-resumo) mais usadas para representar um conjunto de

    dados so a mdia, a moda e a mediana.

    11.1. Mdia aritmtica

    Para dados no-agrupados (ou dados simples)

    Seja X uma varivel que assume os valores x1, x2, x3 ,..., xn. A mdia aritmtica simples de X, representada por x, definida por:

    x1 + x2 + x3 + ... + xn xi x = ------------------------------- ou x = ------- n n

    xi : so os valores que a varivel X assume n: nmero de elementos da amostra observada

    Exemplo: A produo leiteira diria da vaca B, durante uma semana, foi de 10, 15, 14, 13, 16, 19, e 18 litros. Determinar a produo mdia da semana (a mdia aritmtica).

    xi 10 + 15 + 14 + 13 + 16 + 19 + 18 x = --------- x = ---------------------------------------------- = 15 litros n 7

    Para dados agrupados

    Se os valores da varivel forem agrupados em uma distribuio de freqncias ser usada a mdia aritmtica dos valores x1, x2, x3 ,..., xn ponderadas pelas respectivas freqncias absolutas: f1, f2, f3 ,..., fn.

    xi . i

    x = ------------ , onde: n

    xi : valores observados da varivel ou ponto mdio das classes

    i: freqncia simples absoluta

    i = n : nmero de elementos da amostra observada

    A frmula acima ser usada para as distribuies de freqncias sem classes

    e com classes.

    Mdia aritmtica para dados agrupados sem classes (Mdia aritmtica ponderada)

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    35

    (Dados sem classes): Determinar a mdia aritmtica da Tabela 5.4

    Tabela 5.4 - Nmero de filhos de um grupo de 50 casais

    Nmero de filhos ( xi )

    Numero de casais

    ( fi )

    xi . i

    0 6 1 16 2 9 3 8 4 3 5 3 6 3 7 2

    Total ( ) 50

    Mdia aritmtica para dados agrupados com classes intervalares

    (Dados com classes): Determinar a mdia aritmtica da Tabela 5.7

    Tabela 5.7 - Taxas municipais de urbanizao, no Estado de Alagoas (em %) 1970.

    Taxas (em %)

    Nmero de Municpios

    ( fi )

    xi

    xi . i

    6 ---| 16 29 16 ---| 26 24 26 ---| 36 16 36 ---| 46 13 46 ---| 56 4 56 ---| 66 3 66 ---| 76 2 76 ---| 86 2 86 ---| 96 1

    Total ( ) 94

    xi . i

    x = ------------ = ---------- x = n

    Propriedades da mdia aritmtica 1 propriedade

    A soma algbrica dos desvios em relao mdia zero (nula).

    di = (xi - x ) = 0

    Onde: di so as distncias ou afastamentos da mdia.

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    36

    Em uma distribuio simtrica ser igual a zero e tender a zero se a distribuio for assimtrica.

    Idades ( xi ) di = xi - x

    2 d1 = 2 6 = -4 4 d2 = 4 6 = -2 6 d3 = 6 6 = 0 8 d4 = 8 6 = +2 10 d5 = 10 6 = +4

    0

    2 propriedade

    Somando-se ou subtraindo-se uma constante (c) a todos os valores de uma varivel, a mdia do conjunto fica aumentada ou diminuda dessa constante.

    Somar o valor 2 aos dados da tabela e calcular a nova mdia

    Idades ( xi ) xi + 2

    2 2 + 2 = 4 4 4 + 2 = 6 6 6 + 2 = 8 8 8 + 2 = 10

    10 10 + 2 = 12

    40

    A nova mdia ser: 40

    x = ------ = 8. No caso, a mdia aritmtica anterior ficou aumentada de 2. 5

    3 propriedade

    Multiplicando-se ou dividindo-se todos os valores de uma varivel por uma constante (c), a mdia do conjunto fica multiplicada ou dividida por essa constante:

    Multiplicar o valor 2 aos dados da tabela e calcular a nova mdia

    Idades ( xi ) xi x 2

    2 2 x 2 = 4 4 4 x 2 = 8 6 6 x 2 = 12 8 8 x 2 = 16

    10 10 x 2 = 20

    60

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    37

    A nova mdia ser: 60

    x = ------ = 12. No caso, a mdia aritmtica anterior ficou multiplicada por 2. 5

    4 propriedade

    A soma dos quadrados dos afastamentos contados a partir da mdia aritmtica um mnimo.

    Idades ( xi ) di = (xi x) di2 = (xi x)

    2

    2 d1 = 2 6 = -4 ( 4)2 = 16

    4 d2 = 4 6 = -2 ( 2)2 = 4

    6 d3 = 6 6 = 0 ( 0)2 = 0

    8 d4 = 8 6 = +2 ( +2)2 = 4

    10 d5 = 10 6 = +4 ( +4)2 = 16

    0 40

    De modo que: (xi x)2 = 40 sendo este valor o menor possvel. Isso significa que, se tomssemos outro valor que no a mdia (x), o resultado dessa operao seria maior que o obtido.

    5 propriedade

    A mdia aritmtica atrada pelos valores extremos. Considere os valores originais:

    xi : 2, 4, 6, 8, 10 x = 6 Se o primeiro valor xi for alterado para 0:

    xi : 0, 4, 6, 8, 10 x = 5,6 Se o ltimo valor xi for alterado para 12:

    xi : 2, 4, 6, 8, 12 x = 6,4

    11.2. Moda (Mo)

    Tambm chamada de norma, valor dominante ou valor tpico. Defini-se a moda como o valor que ocorre com maior freqncia em conjunto de dados.

    Exemplo: Se o salrio modal dos empregados de uma empresa igual a mil reais, este o salrio recebido pela maioria dos empregados dessa empresa.

    A moda utilizada freqentemente quando os dados esto registrados na escala nominal.

    Exemplo:

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    38

    Sexo dos alunos Turma A Escola Z Sexo Freqncia

    Masculino 40 Feminino 60

    Total 100

    A moda sexo feminino porque tem maior freqncia.

    Para dados no agrupados

    Primeiramente os dados devem ser ordenados para , em seguida, observar o valor que tem maior freqncia.

    Exemplo: Calcular a moda dos seguintes conjuntos de dados:

    1. X = (4, 5, 5, 6, 6, 6, 7, 7, 8, 8) Mo = 6 (0 valor mais freqente) Esse conjunto unimodal, pois apresenta apenas uma moda.

    2. Y = (1, 2, 2, 2, 3, 4, 4, 4, 5, 5, 6) Mo = 2 e Mo = 4 (valores mais freqentes)

    Esse conjunto bimodal, pois apresenta duas modas.

    3. Z = (1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5) Mo = 2, Mo = 3 e Mo = 4 (valores mais freqentes)

    Esse conjunto plurimodal, pois apresenta mais de duas modas.

    4. W = (1, 2, 3, 4, 5, 6) Esse conjunto amodal porque no apresenta um valor predominante.

    Para dados agrupados sem classes

    Basta observar, na tabela, o valor que apresenta maior freqncia. 1) Clculo da moda pelo ROL

    Na Tabela 5.2, o resultado 1 aparece mais vezes Mo =1. Tabela 5.2 - Nmero de filhos de um grupo de 50 casais

    0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 4 4 4 5 5 5 6 6 6 7 7

    2) Clculo da moda pela distribuio de freqncias sem classes

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    39

    Tabela 5.4 - Nmero de filhos de um grupo de 50 casais

    Nmero de filhos ( xi )

    Numero de casais

    ( fi )

    O valor 1 apresenta a maior freqncia. Mo = 1 Esse resultado indica que casais com um filho foi o resultado mais observado.

    0 6

    1 16

    2 9

    3 8

    4 3

    5 3

    6 3

    7 2

    Total ( ) 50

    Para dados agrupados em classes

    Tabela 5.7 Taxas municipais de urbanizao (em %) Alagoas, 1970. Taxas (em %)

    Nmero de Municpios

    ( fi )

    6 --- 16 29 24 16 13 4 3 2 2 1

    16 --- 26 26 --- 36 36 --- 46 46 --- 56 56 --- 66 66 --- 76 76 --- 86 86 --- 96

    Total ( ) 94

    D1

    Frmula de Czuber: Mo = LMo + -------------- x h D1 + D2

    Sendo: LMo : limite inferior da classe h: intervalo da classe modal

    D1: freqncia simples da classe modal freqncia simples anterior da classe modal

    D2: freqncia simples da classe modal freqncia simples posterior da classe modal

    Na Tabela 5.7, temos: 29 LMo = 6 Mo = 6 + ------------- x 10 = 14,5% h = 10 29 + 5

    D1 = 29 0 = 29

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    40

    D2 = 29 24 = 5 A taxa de urbanizao mais freqente ficou em torno de 14,5%.

    11.3. Mediana (Md) uma medida de posio cujo nmero divide um conjunto de dados em duas

    partes iguais. Por esse motivo, a mediana considerada uma medida separatriz. Portanto, a mediana se localiza no centro de um conjunto de nmeros ordenados segundo uma ordem de grandeza.

    Para dados no agrupados

    a) O nmero de valores observados impar Exemplo: Considere o conjunto de dados: X = (5, 2, 7, 10, 3, 4, 1) 1) Colocar os valores em ordem crescente ou decrescente: X = (1, 2, 3, 4, 5, 7, 10) 2) Determinar a ordem ou posio (P) da Mediana por n + 1 P = ------- , quando n (n de elementos) for mpar 2 7 + 1 P = ------- = 4 posio. O nmero que se encontra na 2 4 posio o nmero 4. Md = 4

    b) O nmero de valores observados par Exemplo: Considere o conjunto de dados: X = (4, 3, 9, 8, 7, 2, 10, 6) 1) Colocar os valores em ordem crescente ou decrescente: X = (2, 3, 4, 6, 7, 8, 9, 10) 2) Determinar a ordem ou posio (P) da Mediana por n n P = ---- e P = ---- + 1 2 2 8 8 P = ---- = 4 posio e P = ---- + 1 = 5 posio 2 2 Os nmeros so 6 (4 posio) e 7 (5 posio). Tira-se a mdia aritmtica entre os dois nmeros. 6 + 7 Md = ----------- = 6,5 2

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    41

    Para dados agrupados sem classes

    Tabela 5.4 - Nmero de filhos de um grupo de 50 casais

    Nmero de filhos ( xi )

    Numero de casais

    ( fi )

    Fac

    0 6 6 1 16 22 2 9 31 3 8 39 4 3 42 5 3 45 6 3 48 7 2 50

    Total ( ) 50

    1) Determinar a posio da mediana por: n n P = ---- e P = ---- + 1 , pois n par 2 2 50 50 P = ----- = 25 posio e P = ----- + 1 = 26 posio 2 2 2) Pela Fi (freq. abs. Acum. abaixo de) verifica-se que o 31 contm o 25 e 26 elemento 2 +2 25 corresponde ao n 2 Md = -------- = 2 26 corresponde ao n 2 2 O n 2 deixa 50% dos valores, ou seja, o elemento central.

    Para dados agrupados em classes

    Tabela 5.7 - Taxas municipais de urbanizao (em %) Alagoas, 1970.

    Taxas (em %)

    Nmero de Municpios

    ( fi ) Fac

    6 --- 16 29 29 16 --- 26 24 53 26 --- 36 16 69 36 --- 46 13 82 46 --- 56 4 86 56 --- 66 3 89 66 --- 76 2 91 76 --- 86 2 93 86 --- 96 1 94

    Total ( ) 94

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    42

    n 94 1) Calcular a posio: P = ---- = ---- = 47 posio 2 2 (no importa de n for mpar ou par)

    2) Pela Fi identifica-se a classe que contm a Md: O n 47 est dentro de 53. Portanto, a classe da Md a 2: 16 --- 26. 3) Aplica-se a frmula: Md = LMd + (n/2 Fa) fMd x h onde, * LMd = limite inferior da classe da Md = 16

    * n = tamanho da amostra ou n de elementos

    n/2 = 94/2 = 47 * Fa = frequncia acumulada anterior classe da Md = 29 * h = intervalo da classe da Md = 10 * fMd = frequncia simples da classe da Md = 24

    47 29 Md = 16 + ------------- x 10 = 23,5% 24 50% das taxas de urbanizao esto antes taxa 23,5%.

    11.4. Quartis (medidas separatrizes)

    Dividem um conjunto de dados em quatro partes iguais.

    Q1 = 1 quartil, deixa 25% dos elementos. n 1) Calcular a posio: P = ---- (seja n mpar ou par) 4

    2) Pela Fi identifica-se a classe que contm o Q1 3) Aplica-se a frmula: n/4 Faca Q1 = LQ1 + -------------- x h f Q1

    sendo * LQ1 = limite inferior da classe do Q1 * n = tamanho da amostra ou n de elementos * Faca = frequncia acum. anterior classe do Q1 * h = intervalo da classe do Q1 * f Q1 = frequncia simples da classe do Q1

    Q3 = 3 quartil, deixa 75% dos elementos. 3 n 1) Calcular a posio: P = ----- (seja n mpar ou par) 4

    2) Pela Fi identifica-se a classe que contm do Q3 3) Aplica-se a frmula:

    3n/4 Faca Q3 = LQ3 + -------------- x h f Q3

    sendo * LQ3 = limite inferior da classe do Q3 * n = tamanho da amostra ou n de elementos * Faca = frequncia acum. anterior classe do Q3 * h = intervalo da classe do Q3 * f Q3 = frequncia simples da classe do Q3

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    43

    Q2 = 2 quartil, igual a mediana, deixa 50% dos elementos

    11.5. Decis: dividem a srie em 10 partes iguais in 1) Calcular a posio: P = ---- (seja n mpar ou par), 10 em que i = 1, 2, 3, 4, 5, 6, 7, 8 e 9

    2) Pela Fi identifica-se a classe que contm o Di 3) Aplica-se a frmula:

    in/10 Faca Di = L Di + ---------------- x h f Di

    sendo * LDi = limite inferior da classe Di , i = 1, 2, 3, ..., 9 * n = tamanho da amostra ou n de elementos * Faca = frequncia acum. anterior classe do Di * h = intervalo da classe do Di * f Di = frequncia simples da classe do Di 11.6. Percentis: dividem a srie em 100 partes iguais in 1) Calcular a posio: P = ----- (seja n mpar ou par), 100 em que i = 1, 2, 3, ..., 98, 99

    2) Pela Fi identifica-se a classe que contm o Pi 3) Aplica-se a frmula:

    in/100 Faca Pi = L Pi + ----------------- x h f Pi

    sendo * LPi = limite inferior da classe Pi , i = 1, 2, 3, ..., 99 * n = tamanho da amostra ou n de elementos * Faca = freqncia acum. anterior classe do Pi * h = intervalo da classe do Pi * f Pi = freqncia simples da classe do Pi

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    44

    12. Medidas de disperso (Medidas de variabilidade)

    So medidas utilizadas para medir o grau de variabilidade, ou disperso dos valores observados em torno da mdia aritmtica. Servem para medir a representatividade da mdia e proporcionam conhecer o nvel de homogeneidade ou heterogeneidade dentro de cada grupo analisado.

    Considere a seguinte situao: Um empresrio deseja comparar a performance de dois empregados, com

    base na produo diria de determinada pea, durante cinco dias:

    Empregado A: 70, 71, 69, 70, 70 x = 70.

    Empregado B: 60, 80, 70, 62, 83 x = 71. A performance mdia do empregado A de 70 peas produzidas diariamente,

    enquanto que a do empregado B de 71 peas. Com base na mdia aritmtica, verifica-se que a performance de B melhor do que a de A. Porm, observando bem os dados, percebe-se que a produo de A varia apenas de 69 a 71 peas, ao passo que a de B varia de 60 a 83 peas, o que revela que a performance de A bem mais uniforme do que de B.

    Qual o melhor empregado?

    12.1. Tipos de medidas de disperso

    12.1.1. Medidas de disperso absoluta

    o Amplitude total (AT): a diferena entre o maior e o menor valor observado.

    AT = xmax xmin

    Empregado A = 71 69 = 2

    Empregado B = 83 60 = 23

    o Desvio mdio (DM)

    Analisa todos os desvios ou distncias em relao mdia aritmtica. O clculo dos desvios feito por:

    di = (xi x) onde, di = desvio ou distncia xi = valores observados x = mdia aritmtica

    A soma de todos os desvios em relao mdia aritmtica igual a zero:

    di = (xi x) = 0

    Clculo dos di: Para eliminar a soma zero, coloca-se os desvios em mdulo:

    Empregado A d1 = 70 70 = 0 d2 = 71 70 = +1 d3 = 69 70 = 1 d4 = 70 70 = 0 d5 = 70 70 = 0

    di = 0

    Empregado B

    d1 = 60 71 = 11 d2 = 80 71 = +9 d3 = 70 71 = 1 d4 = 62 71 = 9 d5 = 83 71 = +12

    di = 0

    Empregado A

    d1 = 0 = 0

    d2 = +1 = 1

    d3 = 1 = 1

    d4 = 0 = 0

    d5 = 0 = 0

    di = 2

    Empregado B

    d1 = 11 = 11

    d2 = +9 = 9

    d3 = 1 = 1 d4 = 9 = 9

    d5 = +12 = 12

    di = 42

    Dessa forma, possvel calcular a mdia dos desvios por:

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    45

    di xi x DM = ----------- = ---------------- n n

    Empregado A

    di 2 DM = ----------- = ----- = 0,4 n 5

    Empregado B

    di 42 DM = ----------- = ----- = 8,4 n 5

    Varincia amostral (s2) usada quando o estudo feito por amostragem.

    (xi x)2 s2 = ----------------

    n 1

    Varincia para dados agrupados sem e com classes

    Varincia populacional:

    (xi x)2 . fi 2 = ---------------------

    N

    Varincia amostral:

    (xi x)2 . fi s2 = ---------------------

    n 1 OBS: quando os dados forem uma amostra, usa-se o denominador n 1 na frmula da varincia, pois se obtm uma estimativa melhor do parmetro da populao. Quando a amostra for grande (n > 30) no h diferena entre usar n 1 ou n.

    o Desvio-padro a raiz quadrada da varincia. Na frmula original para o clculo da varincia, observa-se que uma soma de quadrados. Por exemplo, se a unidade original for metro (m) o resultado ser metro ao quadrado (m2). Para retornar a unidade de medida original, extrai-se a raiz quadrada da varincia, passando a chamar-se de desvio-padro.

    Desvio-padro populacional

    = 2

    Desvio-padro amostral

    s = s2

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    46

    12.1.2. Medida de disperso relativa

    o Coeficiente de variao (CV)

    uma medida relativa de disperso til para a comparao em termos relativos do grau de concentrao em torno da mdia de sries distintas.

    Populao

    CV = ------ x 100

    x

    ou

    Amostra s

    CV = ------ x 100 X

    O coeficiente de variao expresso em porcentagem. Duas maneiras de analisar o CV:

    Pequena disperso: CV 10%

    Mdia disperso: 10% CV 20%

    Grande disperso: CV 20%

    Baixa disperso: CV 15%

    Mdia disperso: 15% CV 30%

    Grande disperso: CV 30%

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    47

    PRINCPIO FUNDAMENTAL DA CONTAGEM

    Uma pessoa mora em Nova Iguau e trabalha em Copacabana. Ela vai trabalhar

    todos os dias usando apenas transporte coletivo. Esta pessoa vai Nova Iguau ao Centro do

    Rio tomando nibus, van ou trem. Do Centro do Rio, pode ir a Copacabana de nibus, van

    ou metr. Levando em conta apenas estas possibilidades, de quantas maneiras ela poder ir

    de casa ao trabalho?

    Neste caso podemos contar facilmente todas as 9 possibilidades:

    {(V,V), (V,O), (V,M), (O,V), (O,O), (O,M), (T,V), (T,O), (T,M)},

    onde usamos uma notao em que, por exemplo, (T, M) indica que ela toma o

    primeiro percurso e, em seguida, o metr.

    Em geral a soluo de problemas deste tipo se baseia no princpio multiplicativo,

    tambm chamado de princpio fundamental da contagem.

    Suponha que existam N1 maneiras de se realizar uma tarefa T1 e N2 maneiras de se

    realizar uma tarefa T2. Ento h N1 x N2 maneiras de se realizar a tarefa T1 seguida da

    tarefa T2.

    Exemplo 1

    Na discusso acima, T1 a tarefa de ir de Nova Iguau ao Centro do Rio e N1 = 3

    (h 3 possibilidades de se fazer isto). Da mesma forma, T2 a tarefa de ir do Centro do

    Rio a Copacabana, e h N2 = 3 possibilidades de se realizar esta tarefa. No total, h:

    N1 x N2 = 3 x 3 = 9 possibilidades

    Exemplo 2

  • Universidade Estcio de S

    Disciplina: Probabilidade e Estatstica

    Marcelo Abraho de Mattos

    48

    Um aluno se prepara para ingressar no ensino superior. Ele pode escolher entre 10

    universidades. Se cada uma delas tiver 15 cursos, qua