58
Prof. Silvio Russi 0 Ciências Contábeis Disciplina: Estatística Básica Prof. Silvio Russi do Nascimento 2011

Apostila a Basica Silvio Russi

Embed Size (px)

Citation preview

Page 1: Apostila a Basica Silvio Russi

Prof. Silvio Russi 0

Ciências Contábeis

Disciplina: Estatística Básica

Prof. Silvio Russi do Nascimento 2011

Page 2: Apostila a Basica Silvio Russi

Prof. Silvio Russi 1

Apresentação Seja bem vindo. Nesta nossa disciplina estaremos tratando de assuntos que auxiliam o estudante a coletar, organizar, descrever, analisar e interpretar dados experimentais. Entender a verdadeira essência da estatística como uma ferramenta importante em processos como a tomada de decisão, ajudará o aluno a saber utilizá-la de maneira eficaz nos diferentes níveis da organização (estratégico, tático e operacional) para processos em que se necessite conhecer determinado objeto de estudo. Aprendendo a utilizar esta importante ferramenta, o aluno terá maior apoio em seus processos de tomada de decisão, entre outros, e consequentemente chegar a resultados mais eficazes e adequados em momentos de tomada de decisão, por estar-se utilizando informações tratadas e pertinentes sobre a situação em questão. Porém, esta disciplina exige empenho e dedicação. Seu sucesso dependerá do nível de comprometimento seu com você mesmo. É nossa expectativa que você aprenda bastante. Considerando-se que será você quem administrará seu próprio tempo, nossa sugestão é que você dedique ao menos 2h30min horas por semana para esta disciplina, estudando os textos sugeridos e realizando os exercícios propostos. Uma boa forma de fazer isso é já ir planejando o que estudar, semana a semana. Você deverá buscar entender bastante bem o conteúdo da leitura fundamental, só que essa compreensão será maior, se você acompanhar, também, a leitura complementar. Você mesmo perceberá isso, ao longo dos estudos. É uma disciplina fascinante e útil para você que em breve será um gestor. Os conteúdos estão apresentados de forma didática e por meio de exemplos. Sugere-se, como complemento a utilização de outras bibliografias. Então, vamos ao trabalho.

Page 3: Apostila a Basica Silvio Russi

Prof. Silvio Russi 2

Sumário Parte I

� Unidade 1 - Introdução � Unidade 2- Coletas de Dados. � Unidade 3- Tipos de variáveis. � Unidade 4- Distribuição de freqüências.

Parte II

� Unidade 5- Representação gráfica. � Unidade 6- Medidas de posição. � Unidade 7- Medidas de dispersão.

Page 4: Apostila a Basica Silvio Russi

Prof. Silvio Russi 3

PARTE I

Page 5: Apostila a Basica Silvio Russi

Prof. Silvio Russi 4

Unidade 1 - Introdução

Podemos considerar a estatística como a ciência que se preocupa com a coleta, organização, descrição, análise e interpretação dos dados experimentais. Ouvimos com frequência falar em estatística da bolsa de valores, estatística da loteria esportiva, estatística do crescimento populacional, etc. Normalmente esta parte da estatística diz respeito apenas à parte da descrição e organização dos dados observados. Há ainda todo um campo de atuação da estatística que se refere à análise e interpretação destes dados observados. Os dois modos de estatística são importantes. Para poder-se analisar e interpretar os dados, é necessário que antes seja feita a organização e descrição destes dados. A Estatística se divide em dois modos

– Estatística Descritiva – – Estatística Indutiva

A parte da coleta, organização, descrição faz parte da Estatística Descritiva, enquanto que a análise e interpretação dos dados experimentais faz parte da Estatística Indutiva, como veremos na ilustração abaixo:

ESTATÍSTICAESTATÍSTICAESTATÍSTICAESTATÍSTICA

DESCRITIVADESCRITIVADESCRITIVADESCRITIVA INDUTIVAINDUTIVAINDUTIVAINDUTIVA

coletacoletacoletacoleta organizaçãoorganizaçãoorganizaçãoorganização resumoresumoresumoresumo análiseanáliseanáliseanálise interpretaçãointerpretaçãointerpretaçãointerpretação

Page 6: Apostila a Basica Silvio Russi

Prof. Silvio Russi 5

A Estatística Descritiva é um ramo da estatística que estará descrevendo e resumindo um conjunto de dados. O objetivo da Estatística Indutiva é o de tirar conclusões sobre as populações com base nos resultados observados em amostras extraídas dessas populações e que foram sumarizadas na Estatística Descritiva. Um processo de indução nunca é exato. Estamos sempre sujeitos a erro. A Estatística Indutiva nos dirá até que ponto poderemos estar errando em nosso raciocínio, e com que probabilidade. Em resumo, a Estatística Descritiva trabalha os dados observados para a Estatística Indutiva que busca obter resultados sobre as populações a partir das amostras, dizendo também qual a precisão desses resultados e com que probabilidade se pode confiar nas conclusões obtidas. A Ciência Estatística é de muita importância em qualquer ramo do conhecimento, sendo uma ferramenta de muito valor e fundamental importância no processo de tomada de decisão em qualquer setor de atividade. Áreas como ciências contábeis, engenharia, ciências médicas, finanças entre outros, tendem a usar cada vez mais a estatística como ferramenta de trabalho, daí sua grande e crescente importância. Serão apresentados, a partir de agora, dois conceitos fundamentais para o entendimento da estatística.

– População, ou universo – amostra.

População e Amostra Uma população ou universo, de maneira geral, é um conjunto de elementos, com pelo menos uma característica em comum. Para que um conjunto de elementos seja considerado uma população, esta característica comum deverá definir, sem erros, quais os elementos que pertencem a esta população e quais não pertencem. Os dados que serão observados, na tentativa de se tirar conclusões sobre o fenômeno que nos interessa, serão referentes aos elementos desta população. As populações podem ser finitas, como o conjunto de clientes de uma determinada empresa, ou infinita, como o número de vezes possíveis em que se pode jogar um dado. Para certas finalidades, as populações finitas podem ser consideradas infinitas de acordo com seu tamanho. Como exemplo, considere as pessoas do sexo feminino, com mais de 50 anos de idade residentes na cidade de Minas Gerais. O número dessas pessoas é matematicamente finito, mas tão grande que um

Page 7: Apostila a Basica Silvio Russi

Prof. Silvio Russi 6

pesquisador, ao analisar uma amostra de 500 pessoas, pode considerar a população como infinita. Assim, por exemplo, estamos interessados em fazer uma pesquisa sobre a idade e o sexo dos estudantes universitários da UNIP. Logo, a população física que queremos estudar é aquela constituída pela totalidade dos estudantes universitários da UNIP. Isso parece ser extremamente simples, mas na verdade ainda não temos exatamente caracterizada a população que nos interessa. Será ela constituída apenas de estudantes atuais. Ou deveremos incluir também aqueles que já foram estudantes desta instituição? Além de tudo, ainda teremos o problema de definir qual a característica comum que distingue perfeitamente cada um dos elementos da população que realmente nos interessa pesquisar. Quando são coletadas as informações de toda a população, dizemos que foi feito um Recenseamento. Censo é o conjunto de dados obtidos através do recenseamento. Muitas vezes, por motivos como tempo, orçamento, recursos disponíveis, dificuldades de coleta de dados entre outros, não é possível colher todos os dados de uma população. Por isso, é muito comum fazer-se pesquisas baseadas em amostras desta população que está sendo estudada. Portanto, quando são recolhidas informações de apenas parte da população, diz-se que foi feita uma amostragem. Além deste fato, é importante citar que nem sempre é necessário se examinar toda a população para se chegar às conclusões desejadas. Desde que o tamanho da amostra necessária seja convenientemente determinado, induções suficientemente precisas e confiáveis podem ser realizadas, não havendo necessidade de se onerar o estudo estatístico pelo exame de uma amostra maior ou de toda a população. Portanto, podemos estabelecer que uma amostra é o subconjunto de uma população, necessariamente finito .

• Exemplo de População: Idades de todos os alunos da Universidade Paulista.

• Exemplo de Amostra: Idades de 2.500 alunos da Universidade Paulista.

É intuitivo que, quanto maior a amostra, mais precisas deverão ser as análises e interpretações realizadas sobre as populações. Levando este raciocínio ao extremo, concluiríamos que os resultados mais perfeitos seriam obtidos pelo exame completo de toda a população. Esta conclusão é válida em teoria, mas na prática muitas vezes não se verifica. De fato, o emprego de amostras pode ser feito de modo tal que se obtenham resultados confiáveis, em termos práticos equivalentes, ou até mesmo melhores do que os que seriam conseguidos através de um senso.

Parâmetros – são valores teóricos correspondentes a população.

Page 8: Apostila a Basica Silvio Russi

Prof. Silvio Russi 7

Estatísticas – são funções dos valores amostrais.

Unidade 2- Coletas de Dados. Os dados são registros obtidos por meio de observações, medidas, respostas a pesquisas ou contagens em geral.

Classificação dos Dados Dados Brutos São aqueles valores a que se chegou pela simples coleta, sem qualquer preocupação quanto à sua ordenação. Exemplo: Tabela 1 Consumo Mensal de Energia Elétrica, por 50 Usuários Particulares KWH(quilowatts-hora) 58 62 80 57 08 126 136 96 144 19 90 86 38 94 82 75 148 114 131 28 66 95 121 158 64 118 73 83 81 74 50 92 60 52 89 58 10 105 90 94 09 75 72 157 125 76 88 78 84 36 Como se pode ser observado, as cifras estão dispostas de forma desordenada. Em razão disso, pouca informação se consegue obter inspecionando os dados

DADOS

QUANTITATIVOS QUALITATIVOS

VALORES TIPOS OU

ATRIBUTOS

Page 9: Apostila a Basica Silvio Russi

Prof. Silvio Russi 8

anotados. Mesmo uma informação tão simples como a de saber os consumos máximo e mínimo requer um certo exame dos dados da tabela. Técnicas de amostragem Como podemos determinar quantas pessoas em uma população apresentam certa característica? Por exemplo, quantas são as consumidoras de um determinado estado que comprariam determinado produto? Ou então, da população de determinado estado, quantas pessoas são idosas, qual a incidência de fumantes que desenvolvem doenças pulmonares, quantas pessoas estão desempregadas no país?

Uma forma de responder a essas questões consiste em fazermos um recenseamento, ou seja, colher dados de todos os elementos da população. Mas este é um processo demorado e caro, como citamos anteriormente. Outra maneira possível consiste, então, em colher de um subgrupo desta população em estudo, ou seja, elementos de uma amostra, dados necessários à pesquisa. Se a amostra representa de fato toda a população, podemos utilizar as características dos seus elementos para estimar as características de toda população. Apresentaremos a seguir algumas técnicas de amostragem:

Amostragem Aleatória Simples (AAS): A amostragem aleatória simples é a maneira mais fácil para selecionarmos uma amostra probabilística de um população. Para entendermos melhor, usemos como exemplo um sorteio a ser feito dentro de um Shopping. Os clientes (elementos) deste Shopping preenchem um cupom e colocam na urna. Misturando os cupons nesta urna e sorteando tantos cupons quantos desejarmos na amostra. Importante salientar que todos os elementos têm a mesma probabilidade de ser selecionados. Repete-se o procedimento até que sejam sorteadas todos as unidades estabelecidas da amostra (tamanho da amostra). Podemos ter uma AAS com reposição, se for permitido que uma unidade possa ser sorteada mais de uma vez, e sem reposição, se a unidade sorteada for removida da população. Do ponto de vista da quantidade de informação contida na amostra, amostragem sem reposição é mais adequada. A amostragem sem reposição é mais eficiente que a amostragem com reposição e reduz a variabilidade uma vez que não é possível retirar elementos extremos mais do que uma vez. Amostragem Estratificada: Se a população pode ser dividida em subgrupos que consistem, todos eles, em indivíduos bastante semelhantes entre si, pode-se obter uma amostra aleatória de pessoas em cada grupo. Esse processo pode gerar amostras bastante precisas, mas só é viável quando a população pode ser dividida em grupos homogêneos.

Page 10: Apostila a Basica Silvio Russi

Prof. Silvio Russi 9

Amostragem Sistemática: Quando se cria um sistema para a coleta de dados. Os elementos da população se apresentam ordenados e a retirada dos elementos da amostra é feita periodicamente, temos uma amostragem sistemática. Assim, por exemplo, em uma linha de produção, podemos, a cada dez itens produzidos, retirar um para pertencer a uma amostra da produção diária.

Amostragem a esmo: É a amostragem em que o observador, para simplificar o processo, procura ser aleatório sem, no entanto, realizar propriamente o sorteio usando algum dispositivo aleatório confiável. Por exemplo, se desejarmos retirar uma amostra de 100 grampos de uma caixa contendo 10.000, evidentemente não faremos uma AAS, pois seria muito trabalhosa, por este motivo, retira-se os grampos simplesmente a esmo. Os resultados da amostragem a esmo são, em geral, equivalentes aos da amostragem probabilística se a população é homogênea e se não existe a possibilidade de o observador ser inconscientemente influenciado por alguma característica dos elementos da população. Amostragens intencionais: Enquadram-se aqui os diversos casos em que o observador deliberadamente escolhe certos elementos para pertencer à amostra, por julgar tais elementos bem representativos. O perigo desse tipo de amostragem é grande, pois o Observador pode facilmente se enganar em seu pré-julgamento. Amostragem por voluntários: Ocorre, por exemplo, no caso da aplicação experimental de uma nova droga em pacientes, quando a ética obriga que haja concordância dos escolhidos. Amostragem por conveniência A amostra de conveniência é formada por elementos que estão disponíveis para o pesquisador. Por exemplo, um médico que quer realizar uma pesquisa sobre determinado medicamento, para sua conveniência, realiza a pesquisa com pacientes do hospital em que trabalha.

Page 11: Apostila a Basica Silvio Russi

Prof. Silvio Russi 10

Unidade 3 - Tipos de variáveis.

Chamamos de Variável uma característica de interesse que é medida em cada elemento da amostra ou população. Como o nome diz, seus valores variam de um elemento para o outro. As variáveis podem ser numéricas ou não numéricas.

Variáveis podem ser classificadas da seguinte forma:

Variáveis Quantitativas: quando os dados podem ser distribuídos em categorias mutuamente exclusivas. São as caracterizados por não possuírem valores quantitativos, mas, ao contrário, são definidas por várias categorias. Assim, o sexo, por exemplo, é uma variável qualitativa, pois permite distinguir duas categorias: masculino e feminino. Outro exemplo de variável qualitativa é cor: ou é vermelho ou é preto, etc.

As variáveis quantitativas podem ser nominais ou ordinais:

• Variáveis nominais : não existe ordenação dentre as categorias. Exemplos: sexo, cor dos olhos, fumante/não fumante, doente/sadio.

• Variáveis ordinais : existe uma ordenação entre as categorias. Exemplos: escolaridade (1o, 2o, 3o graus), estágio da doença (inicial, intermediário, terminal), mês de observação (janeiro, fevereiro,..., dezembro).

Ex: Qualidade (defeituosa ou não defeituosa) de peças produzidas por uma máquina. Grupo sanguíneo (A, B, AB ou O) dos alunos doadores de sangue da Universidade.

Variáveis Quantitativas : são as variáveis expressas por números. São variáveis quantitativas: idade, estatura, peso corporal, etc. Podem ser Variáveis quantitativas contínuas ou discretas.

• Variáveis discretas: características mensuráveis que podem assumir apenas um número finito ou infinito contável de valores e, assim, somente fazem sentido valores inteiros. Geralmente são o resultado de contagens. Exemplos: número de filhos, número de bactérias por litro de leite, número de cigarros fumados por dia.

• Variáveis contínuas , características mensuráveis que assumem valores em uma escala contínua (na reta real), para as quais valores fracionais fazem sentido. Usualmente devem ser medidas através de algum instrumento. Exemplos: peso (balança), altura (régua), tempo (relógio), pressão arterial, idade.

Page 12: Apostila a Basica Silvio Russi

Prof. Silvio Russi 11

Exemplo: O peso líquido de cada um dos sabonetes produzidos por uma empresa. A altura dos alunos do 1º ano do Ensino Médio. O diâmetro de parafusos produzidos por uma máquina.

Page 13: Apostila a Basica Silvio Russi

Prof. Silvio Russi 12

Unidade 4- Distribuição de freqüências.

Distribuição de frequências é uma técnica estatística para apresentar uma coleção de elementos classificados de modo a mostrar o número existente em cada segmento.

Elementos de uma distribuição de freqüências a) Freqüência Absoluta: é o número de observações correspondentes a essa classe ou a esse valor. Símbolo fi b) Amplitude Total: é a diferença entre o maior e o menor valor observado da variável em estudo. Símbolo At c) Classe estatística: conjunto de valores numéricos agrupados, caracterizado por um certo intervalo de variação que é definido pelos limites de classe, resultante da subdivisão de uma variável; d) Limites de Classe: os limites de classes são seus valores extremos. A segunda classe do exemplo e) Amplitude de Classe: é a distância entre os limites inferiores (LI) de classes consecutivas Existem dois modos de distribuições de freqüências: Distribuição de Freqüências de dados tabulados não-agrupados e Distribuição de Freqüências de dados agrupados em classes Quando nos referimos ao tipo de apresentação de Distribuição de Freqüências de dados tabulados não-agrupados utilizamos para representar uma variável discreta (que só assume valores pontuais). Critério para definir uma Variável Discreta Devemos optar por uma variável discreta na representação de uma série de valores quando o número de elementos distintos da série for pequeno. Suponha que observamos o número de irmãos de 50 alunos da turma U de estatística

Page 14: Apostila a Basica Silvio Russi

Prof. Silvio Russi 13

Número de irmãos dos alunos da turma U - disciplina Estatística Tabela Distribuição de freqüências por ponto ou val ores do número de irmãos dos alunos da turma U. Disciplina Estatística Observamos pouca variedade na quantidade do número de irmãos dos alunos da turma U, por isso fizemos uma distribuição discreta de freqüências. Agora, observemos a idade, em meses, dos 50 alunos da turma U de estatística. Idade (em meses) dos alunos da turma U - Disciplina Estatística

Page 15: Apostila a Basica Silvio Russi

Prof. Silvio Russi 14

Observando estes valores notamos grande número de elementos distintos, o que significa que neste caso a variável discreta não é aconselhável na redução dos dados. Utilizaremos, então, a distribuição contínua,como mostraremos a seguir. Critério para definir uma Variável Contínua Devemos optar por uma variável contínua na representação de uma série de valores quando o número de elementos distintos da série for grande . Distribuição de Freqüências por classes ou interval os. Idades dos alunos da turma U – Disciplina Estatística

Tabela de distribuição de freqüências Para construirmos uma tabela de distribuição de freqüências, precisamos entender alguns tópicos importantes: Neste momento, precisamos recordar de alguns símbolos que aprendemos ao longo de nossa vida escolar:

Page 16: Apostila a Basica Silvio Russi

Prof. Silvio Russi 15

O símbolo significa: Ou seja, valores que sejam exatamente iguais aos valores mostrados do lado esquerdo do símbolo, entram na contagem da classe. Os valores que estiverem com o mesmo valor do lado direito da do símbolo, não entram naquela classe, e sim na próxima. Vamos a um exemplo: no momento de classificar os valores nas classes, utilizando o exemplo da tabela anterior, o valor 230, sempre que aparecer na coleta destes dados será classificado na classe 1. Já o valor 250, sempre que aparecer nesta coleta de dados, será contabilizado na classe 2,onde ele está contido. O número 250 não está contido na classe 1 e sim na classe 2. Ainda no exemplo de distribuição de freqüências acima, são 7 classes , cada uma com um limite inferior (LI) e um limite superior (LS) da classe. É importante ressaltar que toda classe possui um limite inferior (LI) e um limite superior (LS), como veremos a seguir. Vejamos um exemplo. Considere a distribuição de freqüências abaixo.

Está contido Não está contido

� Cada Classe possui um limite inferior (LI) e um limite superior (LS).

Limite inferior da classe Limite superior da classe

Page 17: Apostila a Basica Silvio Russi

Prof. Silvio Russi 16

A diferença entre o máximo e o mínimo das entradas de dados é chamada Amplitude Total (At). At = x max – xmin

Ex: Se a entrada máxima de dados for 29 e a entrada mínima for 1 a amplitude total será

29 – 1 = 28

A Amplitude de Classes pode ser calculada pela seguinte fórmula: Sendo n o tamanho da amostra, ou se preferir, a somatória das frequências A partir destes tópicos é que começaremos a construir uma tabela de distribuição de freqüências. Pra entendermos melhor este conceito vamos a um exemplo desde o começo, no momento em que os dados ainda não estão agrupados em uma tabela de freqüências. Temos abaixo, dados dos salários de funcionários de um determinado setor de uma empresa. Foi coletada esta amostra de salários, e o que temos são apenas valores coletados. Chamamos estes dados de dados não agrupados .

� Amplitude de classes é a distância entre os limites inferiores (LI) de classes consecutivas

� A amplitude de classes no exemplo citado é Ac = 1000-500 Ac = 500

classes de nº

At AC =

=

=classes de nº n

Page 18: Apostila a Basica Silvio Russi

Prof. Silvio Russi 17

Utilizando–se do exemplo destes dados não agrupados vamos calcular, antes de mais nada, a Amplitude de Classes (AC) . Como vimos, para calcular a amplitude de classes preciso primeiro calcular a amplitude total (At), conforme pedido na fórmula da amplitude de classes At = x max – xmin

Em seguida, precisamos calcular o número de classes que teremos na tabela. Isso se consegue a partir da raiz quadrada do número de elementos da amostra: √√√√50 = 7,07 Nº de classes = 7

At = 3900 – 520 At = 3380

classes de nº

At AC =

classes de nº

At AC =

=

=classes de nº n

Page 19: Apostila a Basica Silvio Russi

Prof. Silvio Russi 18

Portanto,

483~85,4827

3380 AC ==

Arredondar para o primeiro número inteiro superior. Caso o resultado da amplitude de classes de um valor não inteiro, seja ele qual for, sempre deve ser arredondado este valor para o primeiro número inteiro superior . Portanto, sabemos que nossa tabela terá uma amplitude de classe igual a 483.

483~85,4827

3380 AC ==

Page 20: Apostila a Basica Silvio Russi

Prof. Silvio Russi 19

Tipos de freqüências Trabalharemos com três tipos de freqüência:

• Freqüência Simples : Absoluta (fi) • Freqüência Acumulada: Absoluta (Fi) • Relativa (Frel ou Frel%)

Classes de Salários (em reais)

Número de funcionários

520520520520 1003100310031003

1003100310031003 1486148614861486

1486148614861486 1969196919691969

1969196919691969 2452245224522452

2452245224522452 2935293529352935

2935293529352935 3418341834183418

3418341834183418 3901390139013901

Σf= 50f= 50f= 50f= 50

8888

3333

9999

8888

10101010

5555

7777

483483483483

483483483483

483483483483

483483483483

Sempre a menor entradaSempre a menor entradaSempre a menor entradaSempre a menor entrada

Page 21: Apostila a Basica Silvio Russi

Prof. Silvio Russi 20

A tabela acima mostra o número de pessoas matriculadas em cada modalidade de ensino; este número é denominado freqüência Absoluta (fi) � Em Estatística denomina-se freqüência relativa , o resultado obtido da

divisão entre a freqüência que o valor é observado na população e a quantidade de elementos da população.

� Geralmente é apresentada na forma de porcentagem � Podemos encontrar a freqüência relativa para cada modalidade

apresentada em um trabalho estatístico; � Para isso basta dividir a freqüência absoluta de cada modalidade pelo total

de freqüências (Σ f)

f

fabsfr

Σ=

Page 22: Apostila a Basica Silvio Russi

Prof. Silvio Russi 21

Para encontrarmos a frequência acumulada das classes devemos, antes de mais nada, repetir a frequencia absoluta da primeira classe. Em seguida, começamos a somar a freqüência absoluta de cada uma das classes à frequencia acumulada anterior. Por fim, a última soma deve ser igual à somatória das freqüências absolutas.

Page 23: Apostila a Basica Silvio Russi

Prof. Silvio Russi 22

Exemplo: Continuemos do exemplo anteriormente apresentado:

Vamos encontrar agora as freqüências relativas de cada classe:

Page 24: Apostila a Basica Silvio Russi

Prof. Silvio Russi 23

Vamos encontrar agora as freqüências acumuladas de cada classe:

Vamos a mais um exemplo. Considere a tabela de dados abaixo:

A partir da tabela acima, poderemos encontrar as freqüências relativa e acumulada:

Page 25: Apostila a Basica Silvio Russi

Prof. Silvio Russi 24

Page 26: Apostila a Basica Silvio Russi

Prof. Silvio Russi 25

Parte II

Page 27: Apostila a Basica Silvio Russi

Prof. Silvio Russi 26

Unidade 5- Representação gráfica. É através do histograma que representamos uma distribuição de freqüências. Este tipo de gráfico é formado por um conjunto de retângulos agrupados, de maneira que cada área de cada um dos retângulos seja correspondente à freqüência da classe a qual ele representa. Desta maneira, a soma dos valores que correspondem às áreas dos retângulos será sempre igual à somatória de todas as freqüências. Para se construir um histograma, toma-se como referência os eixos Coordenados das ordenadas e das abcissas . No eixo horizontal, são considerados os valores individuais de cada variável em estudo, ou os limites de cada classe. A base horizontal de cada retângulo corresponde a classe. No eixo vertical, ou seja, eixo das ordenadas, serão posicionados os valores de escala onde se identificará os valores relativos ao número de observações ou freqüências da classe. A área correspondente a cada um dos retângulos deste gráfico corresponde à freqüência da classe que o retângulo representa.

Page 28: Apostila a Basica Silvio Russi

Prof. Silvio Russi 27

Também podemos fazer a representação gráfica de dados estatísticos em outros tipos de gráficos, como por exemplo os que mostraremos a seguir. Um destes tipos de gráficos é o gráfico de barras, muito parecido com o histograma, porém, possuem características diferentes, como por exemplo, não existe fronteira entre uma barra e outra, e não se trabalha por classes de freqüências, e sim, por variável. Exemplo:

Número de Matrículas de Educação Básica no Brasil, por Etapas e Modalidade de Ensino, segundo a região

Geográfica em 29/03/2006.

05

1015

20253035

Ed. In

fantil

Ensino

Fun

dam

ental

Ensino

Méd

io

Ed. E

spec

ial

Ed. de

Jove

ns e A

dulto

s

Ed. P

rofis

siona

l

modalidade de ensino

núm

ero

de p

esso

as m

atrícu

lada

s

( em

milh

ões

de a

luno

s)

Page 29: Apostila a Basica Silvio Russi

Prof. Silvio Russi 28

Mais um exemplo de representação gráfica muito útil para a interpretação de dados estatísticos é o Diagrama de Pareto, que permite ao observador, por exemplo, a priorização de problemas. Exemplo: Os dados a seguir foram coletados por determinado método de coleta de dados.

Em seguida, transformam-se as freqüências em freqüências relativa.

Page 30: Apostila a Basica Silvio Russi

Prof. Silvio Russi 29

E em seguida, transforma a tabela em um gráfico:

Page 31: Apostila a Basica Silvio Russi

Prof. Silvio Russi 30

Também podemos citar o gráfico de setores, vulgo gráfico de pizza. Exemplo:

Total (100% - 360 graus)

Page 32: Apostila a Basica Silvio Russi

Prof. Silvio Russi 31

E por fim:

Page 33: Apostila a Basica Silvio Russi

Prof. Silvio Russi 32

Existem mais tipos de gráficos que representam os dados de um estudo estatístico, mas exemplificaremos apenas estes que foram citados.

Page 34: Apostila a Basica Silvio Russi

Prof. Silvio Russi 33

Unidade 6- Medidas de Posição Dizemos como sendo medidas de posição valores que auxiliam na análise da posição da distribuição de freqüências em relação aos valores observados da variável observada. As medidas de posição são divididas em medidas de tendência central , caracterizadas pela tendência dos dados se concentrarem em valores centrais. Medidas de Tendência Central. Existem várias medidas de tendência central, porém, trabalharemos nesta apostila com as três medidas mais conhecidas e utilizadas, Média, Mediana e Moda.

Como dito, as três medidas de tendência central mais usadas são :

� Média

� Mediana

� Moda

Média A média representa o ponto em que os valores um conjunto de dados ou uma seqüência numérica se concentram. Podem ocorrer duas situações:

1º caso: Dados não agrupados São os dados que ainda não foram agrupados em uma distribuição de freqüência, ou seja, os dados estão brutos. Neste caso, utilizamos a média aritmética simples:

χ =n

x∑

Onde, n é o nº de elementos do conjunto

Page 35: Apostila a Basica Silvio Russi

Prof. Silvio Russi 34

Vamos entender como esta mesma fórmula de média poderá ser utilizada em uma situação em que os dados já estão distribuídos em uma tabela de freqüência:

Page 36: Apostila a Basica Silvio Russi

Prof. Silvio Russi 35

2º caso: Dados agrupados sem intervalos (variável d iscreta) Utilizamos a média aritmética ponderada:

χ =n

fx ).(∑

Onde, n é o nº de elementos do conjunto

Exemplo: Dada a amostra, distribuir em uma tabela de frequência: 2, 5, 5, 5, 5, 6, 6, 6, 8, 8

x i f i x if i

2 1 2

5 4 20

6 3 18

8 2 16

Total 10 56

Page 37: Apostila a Basica Silvio Russi

Prof. Silvio Russi 36

Então a média será :

χ =n

fx ).(∑ = 56÷ 10 = 5,6

3º caso: Dados agrupados com intervalos (variável c ontínua) Neste caso, também utilizaremos a fórmula anterior, porém com um detalhe muito importante: como em um intervalo de classe, não se sabe quais são os elementos constantes em cada classe, calculamos o seu ponto médio, “que representará” a classe como sendo o valor de x. Vejamos um exemplo:

Page 38: Apostila a Basica Silvio Russi

Prof. Silvio Russi 37

Page 39: Apostila a Basica Silvio Russi

Prof. Silvio Russi 38

Vamos a outro exemplo para entendermos melhor:

Classe Intervalos f PM

(X) PM . f

(X . f)

1 2 |--- 5 1 3,5 3,5

2 5 |--- 8 10 6,5 65

3 8 |--- 11 8 9,5 76

4 11 |--- 14 1 12,5 12,5

Total 20 157

Foi introduzida a coluna do ponto médio da classe (Pm), obtido assim:

Portanto:

χ =n

fx ).(∑ = 157÷ 20 = 7,85

Interpretação: O valor médio desta série é 7,85, isto é, é o valor em torno do qual os elementos desta série se concentram. Vamos praticar um pouquinho, resolvendo alguns exercícios:

Exercícios: 1) Calcule a média aritmética das séries abaixo: a) 1, 2, 8, 10, 12, 16, 21, 30 b) 5, 6, 6, 10, 11, 11, 20 2) Calcule a média para as tabelas abaixo:

x i f i

2 1

3 4

4 3

5 2

Total

Page 40: Apostila a Basica Silvio Russi

Prof. Silvio Russi 39

x i f i

17 3

18 18

19 17

20 8

21 4

Total

3) O salário de 39 funcionários de um escritório está distribuído segundo o quadro abaixo. Calcule o salário médio destes funcionários.

classe Salários (R$) nº func.

1 400 |--- 500 12

2 500 |--- 600 15

3 600 |--- 700 8

4 700 |--- 800 3

5 800 |--- 900 1

4) Uma imobiliária gerencia o aluguel de residências particulares, segundo o quadro abaixo. Calcule a média:

classe Aluguel (R$) nº casa

1 0 |--- 200 30

2 200 |--- 400 52

3 400 |--- 600 28

4 600 |--- 800 7

5 800 |--- 1000 3

Total

Page 41: Apostila a Basica Silvio Russi

Prof. Silvio Russi 40

5) Em uma empresa temos 4 operários com salário de R$850,00, 2 supervisores com salário de R$1.200,00, 1 gerente com salário de R$2.000,00 e 6 vendedores com salário de R$1.100,00. Qual a média salarial dessa empresa?

Respostas dos exercícios anteriores:

1) a) 12,5 b) 9,86

2) a) 3,6 b) 8,84

3) 562,82 4) 335 5) R$1.107,69 Moda (Mo) A moda de um conjunto de dados é o valor que ocorre com maior freqüência. Um conjunto de dados pode ser:

• Amodal – Nenhum elemento tem a freqüência maior do que os outros

elementos • Modal – apenas um elemento tem a freqüência maior do que os outros

elementos • Bimodal – apenas dois elementos tem a freqüência maior do que os

outros elementos • Trimodal – apenas três elementos tem a freqüência maior do que os

outros elementos • Polimodal – quatro ou mais elementos tem a freqüência maior do que os

outros elementos Vamos a um exemplo:

Como tivemos apenas um elemento se “destacando” em relação à freqüência dos demais, estamos em uma situação MODAL

Page 42: Apostila a Basica Silvio Russi

Prof. Silvio Russi 41

1º Caso: Dados não agrupados: Exemplo: 3, 7, 7, 9, 10, 10, 10, 13, 15.

O elemento que apareceu com maior frequência é o 10, portanto Mo=10 portanto, a série é modal Ex: 2, 4, 8, 11, 12 e 15

Todos os elementos da série apresentam a mesma frequência, logo a série é amodal.

Ex: 2, 2, 5, 5, 8, 9

Temos Mo=2 e Mo=5 (bimodal)

2º Caso: Dados agrupados sem intervalo de classes Só precisamos identificar o elemento que aparece com maior freqüência.

xi fi

0 2

2 4

3 5

4 2

6 3

Portanto Mo=3, situação modal Preste atenção que a moda é o elemento 3, que tem uma freqüência de 5

Page 43: Apostila a Basica Silvio Russi

Prof. Silvio Russi 42

3º Caso: Dados agrupados com intervalos Observe a tabela:

classe amostra fi

1 0 I----- 10 1

2 10 I----- 20 3

3 20 I----- 30 6

4 30 I----- 40 2

Para encontrar a classe modal de dados agrupados em classes, Identificamos aquela que possui maior freqüência Neste caso, a classe 3:

classe amostra fi

1 0 I----- 10 1

2 10 I----- 20 3

3 20 I----- 30 6

4 30 I----- 40 2

Exercícios: 1) Calcule a moda para as séries abaixo: a) 2, 2, 3, 4, 5, 5, 5, 7 b) 3, 4, 4, 5, 9, 12, 12 Calcule a moda das distribuições abaixo:

x i f i

2 1

3 7

4 2

5 2

Total

Page 44: Apostila a Basica Silvio Russi

Prof. Silvio Russi 43

x i f i

17 3

18 18

19 17

20 8

21 4

Total

3) A distribuição abaixo representa o consumo em Kg de um produto colocado em oferta em um supermercado. Calcule a cl asse modal:

classe consumo nº de clientes

1 0 |--- 1 12

2 1 |--- 2 15

3 2 |--- 3 21

4 3 |--- 4 32

5 4 |--- 5 20

4) A distribuição abaixo representa o número de aci dentes de trabalho por dia em uma indústria Petroquímica, verificados dura nte um mês. Calcule a classe modal:

classe nº de acidentes

nº de dias

1 0 |--- 2 20

2 2 |--- 4 6

3 4 |--- 6 3

4 6 |--- 8 1

Page 45: Apostila a Basica Silvio Russi

Prof. Silvio Russi 44

Respostas: 1) a) 5 b) 4 e 12 2) a) 3 b) 18 3) classe 4 4) classe1 Mediana (Md) A mediana divide um conjunto ordenado de dados em duas partes com igual número de elementos, ou seja, 50% de elementos para um lado e 50% dos elementos para o outro lado.

1º caso: Dados não agrupados O primeiro passo para obtermos a mediana é colocamos a seqüência numérica em ordem crescente ou decrescente. Depois, verificamos se a amostra é par ou ímpar e adotamos um dos procedimentos a seguir. Se a amostra é constituída por um número ímpar de elementos, a mediana é o valor que fica no centro dos dados ordenados. Exemplo (n ímpar): 5, 13, 10, 2, 18, 15, 6, 16 e 9 : Colocar os valores em ordem crescente: 2, 5, 6, 9, 10, 13, 15, 16, 18. Se n=9, ou seja, temos nove elementos, sendo a série composta por um número ímpar de elementos, logo, o elemento que se encontra na posição central após colocarmos todos em ordem crescente( ou decrescente) é o número 10. Portanto Md= 10 Outro exemplo:

Page 46: Apostila a Basica Silvio Russi

Prof. Silvio Russi 45

Porém, se a amostra é constituída por um número par de elementos, a mediana é a média aritmética dos dois valores centrais dos dados ordenados. Exemplo (n par): 7, 2, 6, 12, 10, 18, 13 e 21 Colocar em ordem crescente: 2, 6, 7, 10, 12, 13, 18 e 21 O número de elementos do exemplo é n=8, portanto, a mediana está entre o 4º e o 5º elementos, ou seja, 10 e 12. Para encontrarmos a mediana, calculamos a média aritmética dos dois valores centrais, ou seja: 10 + 12 2 Obtemos assim, o valor 11, que é, portanto, a mediana desta série de números Vejamos alguns exemplos.

Page 47: Apostila a Basica Silvio Russi

Prof. Silvio Russi 46

2º Caso: Dados agrupados com intervalos (variável c ontínua) Dada a tabela:

Classe Amostra f i Fi

1 3 |--- 6 2 2

2 6 |--- 9 5 7

3 9 |--- 12 8 15

4 12 |--- 15 3 18

5 15 |--- 18 1 19

Total 19

1º Passo: Antes de mais nada, identificar a posição da mediana. A classe da mediana é aquela que contém o elemento de ordem n/2 (na freqüência acumulada ) 2º Passo: Pela freqüência acumulada (F) identificamos a classe que contém a mediana (classe da Md). 3º Passo: Utiliza-se a fórmula:

Md = li + n/2 – facum ant . h f md

Page 48: Apostila a Basica Silvio Russi

Prof. Silvio Russi 47

Onde: li= limite inferior da classe da mediana n = tamanho da amostra facumant= freqüência acumulada anterior à classe da mediana (ou soma dos valores de fi anteriores à classe da mediana) h = amplitude da classe da mediana fmd = freqüência da classe da mediana No exemplo da tabela anterior: 1º Passo: Com n=19, temos 19/2=9,5 2º Passo : Identifica-se a classe da mediana pela facum. Neste caso, a classe da mediana é a 3ª, ou seja na classe 9 |--- 12 (9,5 está entre 9 e 12) 3º Passo: Aplica-se a fórmula: Md = 9 + 19/2 – 7 . 3 15 Md = 9 + 0,17 . 3 Md = 9 + 0,51 Md = 9,51 Interpretação: 50% dos valores da série são valores menores ou iguais a 9,51 e 50% dos valores da série são valores maiores ou iguais a 9,51.

Md = li + n/2 – facum ant . h f md

Page 49: Apostila a Basica Silvio Russi

Prof. Silvio Russi 48

Vamos exercitar um pouco este capítulo:

Exercícios: 1) Calcule a média aritmética das distribuições aba ixo:

notas fi salários f i vendas f i

2 5 520 18 145 10

3 8 780 31 158 9

5 14 940 15 163 8

8 10 1.240 3 175 4

10 7 1.590 1 187 2

Total Total

Total

tabela a tabela b tabela c

2) Calcule a moda para as tabelas acima. 3) Calcule a mediana para as tabelas acima.

4) Calcule a média para as tabelas apresentadas a s eguir:

Salários(R$) nº funcionários Estaturas(cm) fi

200 |--- 400 15 150 |--- 158 5

400 |--- 600 158 |--- 166 12

600 |--- 800 8 166 |--- 174 18

800 |--- 1.000 2 174 |--- 182 27

1.000 |--- 1.200 1 182 |--- 190 8

total total

Page 50: Apostila a Basica Silvio Russi

Prof. Silvio Russi 49

Notas nº alunos pesos (Kg) Fi

0 |--- 2 5 145 |--- 151 10

2 |--- 4 8 151 |--- 157 9

4 |--- 6 14 157 |--- 163 8

6 |--- 8 10 163 |--- 169 5

8 |--- 10 7 169 |--- 175 3

Total Total

5) Calcule a mediana para as tabelas acima. 6) Calcule a moda para as tabelas acima.

Respostas:

1- a) 5,77 b) 778,68 c) 159,09

2 – a) 5 b) 780 c) 145

3 – a) 5 b) 780 c) 158

4 – a) 500 b) 172,40 c) 5,27 d)156,91

5 – a) 466,67 b) 174 c) 5,29 d)156

6 - a) 366,67 b) 176,57 c) 5,20 d)150,45

Page 51: Apostila a Basica Silvio Russi

Prof. Silvio Russi 50

Unidade 7- Medidas de dispersão. As medidas de dispersão indicam o quanto os dados variam em torno da região central. São medidas de dispersão:

• Amplitude. • Variância. • Desvio-padrão. • Coeficiente de Variação

Amplitude A amplitude é a diferença entre o maior e o menor dado observado. At = X max – X mín Exemplo: No conjunto de dados: 2, 5, 6, 9, 10, 10, 12, 15, 18, 20, a amplitude é: 20-2=18. Variância

A variância de uma variável aleatória é uma medida que indica quão longe em geral os seus valores se encontram em relação a sua média.

A para dados não agrupados é calculada pela fórmula

S2 = 1

)( 2

−−∑

n

xx

Page 52: Apostila a Basica Silvio Russi

Prof. Silvio Russi 51

A variância para dados agrupados é calculada pela fórmula

S2 = 1

)( 2

−−∑

n

fxx

Onde, S2 = variância amostral _ X = média amostral X = elemento para variável discreta, ou Ponto Médio para variável contínua n= tamanho da amostra f= freqüência do elemento ou da classe Desvio Padrão É a raiz quadrada da variância.

S = S2

Onde, S2 = variância amostral S = Desvio Padrão amostral Coeficiente de Variação É o coeficiente entre o desvio padrão e a média entre o Desvio Padrão e a média.

CV = X

Sx 100

Page 53: Apostila a Basica Silvio Russi

Prof. Silvio Russi 52

1

) ( 2

− −

n

x x S2 =

Page 54: Apostila a Basica Silvio Russi

Prof. Silvio Russi 53

Exemplo:

Grupo 1 Grupo 2 150 150 151 151 151 152 152 152 153 153

148 150 155 160 165 170 180 190 195 200

∑ x = 1515 ∑ x = 1713

Vamos aos cálculos de cada grupo, e em seguida comparar seus desvios padrões, suas variâncias e seus coeficientes de variação:

Page 55: Apostila a Basica Silvio Russi

Prof. Silvio Russi 54

Para o Grupo 1: χ = 1515÷ 10 = 151,5 cm

S2 = 1,1664 cm 2 S = 1,08 cm

CV = X

Sx 100

CV = (1,08 ÷ 151,5 ) . 100 = 0,71%

Para o Grupo 2: χ = 1713÷ 10 = 171,3 cm

S2 = 326,89cm 2 S = 18,98 cm

CV = X

S x 100

CV = (18,98 ÷ 171,3 ) . 100 = 11,08%

1

) ( 2

− −

n

x x S2 =

1

) ( 2

− −

n

x x S2 =

Page 56: Apostila a Basica Silvio Russi

Prof. Silvio Russi 55

Importante: Quanto maior o desvio padrão a variação dos dados em relação à média será maior, ou seja, existe uma maior dispersão dos dados em relação a quando o resultado do desvio padrão é menor. Quanto menor o desvio padrão, menor a dispersão dos dados. Portanto, o grupo que possui maior dispersão dos dados é o grupo 2.

Page 57: Apostila a Basica Silvio Russi

Prof. Silvio Russi 56

χ =n

fx ).(∑

χ = 2250 reais

S2 = 1

)( 2

−−∑

n

fxx

S2 = 969.387,76 reais 2 S = 984,58 reais

CV = X

S x 100

CV = (984,58 ÷ 2250) . 100 = 43,76% A partir de agora é com você, aluno. Estude os tópicos trabalhados com bastante atenção. Observe cada detalhe apresentado anteriormente, pois são dicas preciosas para a resolução dos problemas. Analise os resultados e tente tirar conclusões a partir dele. Compreendendo bem a disciplina, temos certeza de que ela será muito útil na sua vida acadêmica, profissional e até mesmo pessoal. Lembre-se, a estatística está presente no dia a dia das pessoas, fique atento a como utilizá-la correta e eficazmente. Até breve!

Page 58: Apostila a Basica Silvio Russi

Prof. Silvio Russi 57

Referências Bibliográficas Barrow, Michael - Estatística para economia , contabilidade e administração – Editora Ática, 2007 YE Myers, Walpole Mayers - Probabilidade e Estatística para egenharia e Ciências 8ª Edição Pearson /Prentice Hall, 2008 Sincich, McClave Benson - Estatística para Administração e Economia - 10ª Edição Pearson /Prentice Hall, 2008 Profa. Mirtes Vitória Mariano - Material Estatística Descritiva – 2008 Profa. Maria Ester Domingues de Oliveira - Material Estatística Descritiva – 2008