101
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA Disciplina: Probabilidade e Estatística (6 créditos) Período 2009.2 Prof. Gilberto Matos e Areli Mesquita Aluno(a): . 1 a NOTA DE AULA 1 Introdução à Estatística 1.1 A Ciência Estatística O conceito de Estatística pode ser considerado de duas maneiras. O primeiro conceito, logo relaciona a Estatística com tabelas e gráficos nos quais os dados obtidos são represen- tados, ou melhor, relaciona à números específicos. Ouvimos, assim, falar em estatísticas do IBGE, estatísticas relacionadas à saúde e educação, índices econômicos, pesquisas de opinião, etc. Um segundo conceito refere-se ao conjunto de processos ou técnicas em- pregadas na investigação e análise de fenômenos. Neste caso, a Estatística é a ciência ou método científico que estuda os fenômenos aleatórios e, procura inferir as leis que os mesmos obedecem. Assim, um conceito mais abrangente e absoluto deve englobar tanto o primeiro conceito, o qual é o mais popular, quanto o segundo, o qual normalmente escapa à noção corrente. Definição 1.1 (Estatística). A Estatística é uma ciência que se preocupa com a coleta, organização, descrição, análise e interpretação dos dados, a fim de extrair in- formações a respeito de uma população. Dentro dessa idéia, podemos considerar a Ciência Estatística como dividida basica- mente em duas partes: 1. Estatística Descritiva - que se preocupa com a organização e descrição dos dados experimentais; 2. Estatística Inferencial - que, a partir da observação de alguns dados experimentais, realiza a análise e interpretação de dados com o objetivo de generalizar e prever resultados, utilizando-se para isto da Teoria das Probabilidades. Nesta disciplina, serão abordados tópicos referentes à estatística descritiva, conceitos fundamentais de probabilidade e os modelos probabilísticos mais importantes para o estudo da inferência estatística. 1

Probab Il i Dade

Embed Size (px)

Citation preview

Page 1: Probab Il i Dade

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus IUNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICADisciplina: Probabilidade e Estatística (6 créditos) Período 2009.2Prof. Gilberto Matos e Areli MesquitaAluno(a): .

1a NOTA DE AULA

1 Introdução à Estatística

1.1 A Ciência Estatística

O conceito de Estatística pode ser considerado de duas maneiras. O primeiro conceito,logo relaciona a Estatística com tabelas e gráficos nos quais os dados obtidos são represen-tados, ou melhor, relaciona à números específicos. Ouvimos, assim, falar em estatísticasdo IBGE, estatísticas relacionadas à saúde e educação, índices econômicos, pesquisas deopinião, etc. Um segundo conceito refere-se ao conjunto de processos ou técnicas em-pregadas na investigação e análise de fenômenos. Neste caso, a Estatística é a ciênciaou método científico que estuda os fenômenos aleatórios e, procura inferir as leis que osmesmos obedecem. Assim, um conceito mais abrangente e absoluto deve englobar tanto oprimeiro conceito, o qual é o mais popular, quanto o segundo, o qual normalmente escapaà noção corrente.

Definição 1.1 (Estatística). A Estatística é uma ciência que se preocupa com a

coleta, organização, descrição, análise e interpretação dos dados, a fim de extrair in-formações a respeito de uma população.

Dentro dessa idéia, podemos considerar a Ciência Estatística como dividida basica-mente em duas partes:

1. Estatística Descritiva - que se preocupa com a organização e descrição dos dadosexperimentais;

2. Estatística Inferencial - que, a partir da observação de alguns dados experimentais,realiza a análise e interpretação de dados com o objetivo de generalizar e preverresultados, utilizando-se para isto da Teoria das Probabilidades.

Nesta disciplina, serão abordados tópicos referentes à estatística descritiva, conceitosfundamentais de probabilidade e os modelos probabilísticos mais importantes para o estudoda inferência estatística.

1

Page 2: Probab Il i Dade

1.2 Estatística: Uma Visão Sistêmica

(Desenhar figura representando uma visão sistêmica da estatística)

1.3 Conceitos Fundamentais

Um dos principais conceitos utilizados na estatística é o de população.

1.3.1 População e Amostra

Definição 1.2 (População). A população é um conjunto de todos os elementos

(pessoas, objetos, etc) que possuem pelo menos uma característica em comum, a(s)qual(is) os relacionam ao problema que está sendo estudado.

Exemplo 1. Se o problema a ser pesquisado está relacionado com a qualidade de umcerto produto produzido numa indústria, a população pode ser composta por todas aspeças produzidas numa determinada hora, turno, dia ou mês, dependendo dos objetivos;

Exemplo 2. Se o objetivo de um estudo é pesquisar o nível de renda familiar de umacerta cidade, a população seria todas as famílias desta população. Mas, se o objetivofosse pesquisar apenas a renda mensal do chefe da família, a população a ser pesquisadaseria composta por todos os chefes de família desta cidade.

2

Page 3: Probab Il i Dade

A População pode ser:

1. Finita - quando o número de unidades de observação pode ser contado e é limitado;

2. Infinita - quando a quantidade de unidades de observação é ilimitada;

Podemos citar como exemplo de população finita o conjunto formado pelos alunosque cursam a disciplina de estatística num determinado semestre da UFCG. Um exemplo depopulação infinita seria o conjunto formado por todos os alunos de estatística do Brasil,pois este conjunto é composto por um número incontável de elementos.

Definição 1.3 (Amostra). A amostra é apenas uma parte da população, ou seja, é

um subconjunto da população.

Vários motivos levam a necessidade de se observar apenas uma parte da população,como, por exemplo: a falta de tempo, recursos financeiros e/ou humanos. A amostra deveser obtida através de técnicas de amostragem, as quais tem como objetivo principalgarantir a representatividade da população, ou seja, fazer com que a amostra seja umretrato fiel da população.

Exemplos de amostra podem ser conjuntos formados por apenas uma parte dos ele-mentos populacionais descritos nos Exemplos 1 e 2.

1.3.2 Parâmetro e Estatística

Dois novos conceitos estreitamente relacionados com os de população e amostra sãoos de Parâmetro e Estatística, tendo em vista que:

Definição 1.4 (Parâmetro). é uma medida numérica que descreve uma característica

da população, ou ainda, que é obtida a partir de todos os dados populacionais (atravésde um censo).

Definição 1.5 (Estatística). é uma medida numérica que descreve uma característica

da amostra, ou ainda, que é obtida a partir de dados amostrais (de uma parte dapopulação).

Exemplos de algumas medidas numéricas são: proporção, média, moda, índices, etc.

3

Page 4: Probab Il i Dade

1.3.3 Variáveis (ou Dados) e Tipos de Variáveis

Definição 1.6 (Variável). Uma Variável nada mais é que uma característica (ou

dado) associada a cada elemento da população ou amostra. A variável apresenta dife-rentes valores, quando sujeita a mensurações sucessivas, e, em geral, é denotada pelasletras maiúsculas: X, Y ou Z.

Antes de realizar qualquer tratamento estatístico de um conjunto de dados, é impor-tante identificar qual é o tipo de dado (ou variável) que será analisado, pois, é mediantea este conhecimento que o pesquisador poderá ou não adotar determinadas técnicas esta-tísticas para a resolução de problemas. Por exemplo, será que é possível calcular o pesomédio de lutadores de boxe, quando os dados são coletados segundo a categoria de peso:Leve, Médio ou Pesado?

Tipos de Variáveis

Basicamente, as variáveis podem ser classificadas como sendo Qualitativas ou Quan-titativas.

1. Variáveis Qualitativas - quando os valores que elas podem receber são referentesà qualidade, atributo ou categoria. Exemplos são:

• Raça: podendo assumir os valores Branco ou Negro;

• Sexo: Masculino ou Feminino;

• Escolaridade: 1 grau completo, 2 grau completo, superior, pós-graduado;

• Conceito de qualidade: péssima qualidade, regular ou boa qualidade.

As variáveis qualitativas podem, ainda, ser classificadas como: Nominais ou Ordi-nais.

(a) As variáveis qualitativas nominais - são caracterizadas por dados que seapresentam apenas sob o aspecto qualitativo (Ex: raça e sexo).

(b) As variáveis qualitativas ordinais - são caracterizadas por categorias queaprentam uma ordenação natural. Por exemplo: escolaridade e conceito dequalidade.

2. Variáveis Quantitativas - quando os valores que ela pode assumir são numéricos,os quais podem ser obtidos através de uma contagem ou mensuração.

As variáveis quantitativas podem ser classificadas de acordo com o processo de ob-tenção; podendo ser: Discreta ou Contínua.

(a) As variáveis quantitativas discretas - são variáveis numéricas obtidas a partirde procedimento de contagem. Por exemplo: Quantidade de pessoas numafamília, quantidade de acidentes numa indústria, etc.

4

Page 5: Probab Il i Dade

(b) As variáveis quantitativas contínuas - são variáveis numéricas cujos valoressão obtidos por um procedimento de mensuração, podendo assumir quaisquervalores num intervalo dos números reais, como por exemplo, a temperatura,altura, salário, etc..

Observação 1. O fato de uma variável poder ser expressa por números não significaque ela seja necessariamente quantitativa, por que a classificação da variável dependede como foi medida. Por exemplo, para a variável peso de um lutador de boxe, sefor anotado o peso marcado na balança, a variável é quantitativa contínua; por outrolado, se esse peso for classificado segundo as categorias do boxe, a variável é qualitativaordinal.

1.4 Fases do Método Estatístico

Assim como qualquer ciência, a estatística utiliza o método científico, que consiste dascinco etapas básicas seguintes:

1. Definir cuidadosamente o problema.

Nesta etapa o pesquisador deve certificar-se de que é clara a finalidade de um estudoou análise. Ao definir o que se quer estudar, ou seja, o problema, é necessário quese faça um levantamento sobre quais estudos já realizados no campo de pesquisaabordado. Deve-se também especificar quem ou o quê será observado no estudo, ouseja, a população a ser pesquisada.

2. Formular um plano para a coleta dos dados adequados.

Nesta fase, o pesquisador deverá listar as variáveis (características ou dados) quesejam relevantes para se atingir os objetivos propostos pela pesquisa. Além disso,deve-se decidir se a coleta dos dados será realizada através de um censo ou amos-tragem, ou seja, se todos os elementos da população serão observados ou se apenasuma parte da população é que será observada e neste último caso deve-se decidir poralguma técnica de amostragem, podendo ser probabilística ou não.

Os dados podem ser classificados quanto à forma de coleta, como:

a. Dados primários - quando o próprio pesquisador é quem elabora e aplica osinstrumentos necessários para a coleta dos dados, ou seja, quando a Coleta é Direta;b. Dados secundários - quando o pesquisador utiliza informações já colhidas poroutrem, retirando-as de livros, revistas, mapas anuários, etc.

3. Coligir ou apurar os dados.

Esta fase consiste em resumir os dados, através de sua contagem e agrupamento.É possível que nesta fase seja identificado a presença de dados absurdos fazendo-senecessário a eliminação ou correção destes tipos de dados.

4. Analisar e interpretar os dados.

5. Relatar as conclusões de maneira que sejam facilmente entendidas por quem as forusar na tomada de decisões.

5

Page 6: Probab Il i Dade

1a LISTA DE EXERCÍCIOS

1 - Defina e/ou explique com suas próprias palavras, o que você entende por CiênciaEstatística e quais os principais ramos (partes) da Estatística.

2 - Através de um exemplo, defina: População e Amostra.

3 - Considere as seguintes situações:

1) Em uma pesquisa, feita pela EMPETUR com 1015 pousadas escolhidas aleato-riamente, 269 (ou 26,5%) possuíam Home-page na Internet para divulgação eprestação de serviços ao turista.

2) Outra pesquisa feita entre as 50 Agências de Viagens de uma certa localidademostra que 42 (ou 84%) prestam serviços pela Internet.

Identifique em qual das situações nós temos um exemplo de Parâmetro e outro deEstatística (no sentido de medida). Justifique sua resposta.

4 - O que você entende por variável? Justifique a sua resposta por intermédio de umexemplo.

5 - Como você diferencia uma variável discreta de uma variável contínua? Utilize umexemplo para melhor ilustrar.

6 - Defina e/ou explique com suas próprias palavras, o que você entende por amostragem.

7 - Qual é o principal objetivo de qualquer plano de amostragem?

8 - As estatísticas geradas por intermédio de uma amostra devem ser representativasdesta amostra ou da população de origem? Justifique a sua resposta.

9 - Para que uma amostra seja representativa, é necessário apenas que a mesma tenhaum tamanho apropriado? Justifique a sua resposta.

10 - A Revista dos Eventos, N 13, tentando sanar, ao menos parcialmente, a carênciade informações precisas sobre a indústria de eventos, promoveu a 1a PESQUISA -O Mercado de Congressos no Brasil. Os resultados desta pesquisa se baseiam em40 questionários respondidos sobre um total de 1000, os quais foram encaminhadospor entrega pessoal a dirigentes de entidades integrantes do cadastro da própriaRevista dos Eventos. Qual é o problema ou a limitação desta pesquisa? Pelo menosteoricamente, qual seria o melhor procedimento para este tipo de pesquisa, já que aempresa possui um cadastro das entidades?

11 - Classifique cada uma das informações (variáveis) abaixo, de acordo com os tipos devariáveis.

a) Nome b) Nível de satisfação

c) Idade d) Número de dias hospedado

6

Page 7: Probab Il i Dade

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus IUNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICADisciplina: Probabilidade e Estatística (6 créditos) Período 2009.2Prof. Gilberto Matos e Areli MesquitaAluno(a): .

2a NOTA DE AULA

2 Análise Exploratória de Dados / Estatística Des-

critiva

2.1 Introdução

A estatística pode ser considerada como um instrumento ou um conjunto de métodosmatemáticos que devem ser utilizados quando se pretende transformar dados em informação.Para ilustrar este processo, veja a Figura 1:

12 15 1815 12 1818 15 1817 19 20

Conjunto de dados

MédiaModa

MedianaProporçãoQuantis

Conjunto de informações

Figura 1:

No primeiro retângulo, tem-se um conjunto de observações da variável idade de umgrupo de 12 pessoas e, no segundo retângulo, as estatísticas (informações) que podemrepresentar esses números.

2.2 Organização de dados: Tabelas e Gráficos

2.2.1 Distribuição de Frequências

O primeiro passo para se resumir um conjunto de dados é ordená-los em ordem cres-cente ou decrescente, e proceder a contagem do número de ocorrência (freqüência) de cadadado. À ordenação dos dados denominamos de Rol. Assim, o rol para o conjunto de dadosda Figura 1 fica:

Rol de dados: (Organize!)

7

Page 8: Probab Il i Dade

Desta maneira, fica fácil verificar a freqüência com que cada um dos dados foi obser-vado, por exemplo: o valor 12 ocorreu 2 vezes; o valor 15 ocorreu 3 vezes, e assim pordiante.

Uma maneira adequada de apresentar os dados e suas respectivas freqüências é atravésde uma Tabela de Freqüências, a qual é constituída por uma coluna referente aosdados e outra referente às freqüências associadas a cada valor observado (ni). Vejacomo fica para o conjunto de dados da Figua 1:

Tabela 1: Tabela de Freqüências da variávelidade, para um grupo de 12 pessoas.Idade Frequência (ni)

12 215 317 118 419 120 1

Total de observações (n) 12

Uma medida bastante útil na interpretação de tabelas de freqüências é a freqüênciarelativa (fri), a qual é dada pela razão entre a freqüência do i-ésimo valor observado, ni eo total de dados observados, n. Pode-se, ainda, representar a freqüência relativa em termosde porcentagem, bastando para isso multiplicar a freqüência relativa fri por 100.

Para alguns tipos de variáveis, tais como a qualitativa ordinal e as quantitativas (dis-creta ou contínua), pode ser útil também, a informação de quantas observações apresentamvalores menores ou iguais a um certo valor fixado. Este tipo de informação é denominadode freqüência acumulada, fac, a qual também pode ser expressa em termos relativos oupor porcentagens.

Vejamos, agora, como fica a tabela de freqüências anterior com estas informaçõesadicionadas:

Tabela 2: Tabela de Freqüências da variávelidade, para um grupo de 12 pessoas.

Idade ni fri fri × 100 (%) fac (%)12 2 0,1667 16,67 16,6715 3 0,2500 25,00 41,6717 1 0,0833 8,33 50,0018 4 0,3333 33,33 83,3319 1 0,0833 8,33 91,6720 1 0,0833 8,33 100,00

Total (n) 12 1,0000 100,00

Observação: Ao conjunto de todos os pares de valores, referentes a cada dado obser-vado e sua respectiva freqüência, denominamos de Distribuição de Freqüências. Desta

8

Page 9: Probab Il i Dade

forma, os pares (12, 2), (15, 3), (17, 1), (18, 4), (19, 1) e (20, 1) representam a distribuiçãode freqüências da variável idade para esse grupo de pessoas.

Representação Gráfica

Uma representação gráfica da distribuição de freqüências de uma variável tem a van-tagem de, numa maneira rápida e concisa, informar sobre a variabilidade da mesma.

Gráfico de Colunas - é mais adequado para variáveis discretas mas também pode serutilizado para variáveis qualitativas ordinais, ou ainda, para variáveis qualitativas nominaiscujos nomes das categorias são pequenos.

Neste gráfico, cada valor observado é representado por retângulos de mesma basee alturas proporcionais às freqüências. Para ilustrar, veja como fica este gráfico para adistribuição de freqüências da variável idade, utilizando a freqüência absoluta e relativa emtermos de porcentagem:

Figura 1:

Distribuição de freqüências da variável idade

2

3

1

4

1 1

0

0.5

1

1.5

2

2.5

3

3.5

4

4.5

12 15 17 18 19 20Idade (anos)

Freq

üênc

ia (n

_i)

Figura 2:

Distribuição de freqüências da variável idade

16.7%

25.0%

8.3%

33.3%

8.3% 8.3%

0.0%

5.0%

10.0%

15.0%

20.0%

25.0%

30.0%

35.0%

40.0%

45.0%

50.0%

12 15 17 18 19 20Idade (anos)

Freq

üênc

ia (%

)

9

Page 10: Probab Il i Dade

Exercício de Fixação

1 - O seguinte conjunto de dados é referente ao número de acidentes por dia em certotrecho de rodovia no mês de setembro de certo ano:

2 0 1 2 3 1 6 1 0 01 2 2 1 2 0 1 4 2 30 1 0 2 1 2 4 1 1 1

Responda as seguintes questões:

a) Qual o número mínimo de acidentes, num certo dia? E o número máximo?

b) Freqüêntemente, ocorreram quantos acidentes por dia? E o que isso representaem termos de percentuais?

c) Represente graficamente a distribuição de frequência da variável número deacidentes por dia, no mês de setembro.

d) Faça um gráfico de colunas para o percentual acumulado.

2.2.2 Distribuição de Frequências para Dados Agrupados em Classes

Em algumas situações, é necessário o agrupamento de dados em categorias ou classespara se proceder a construção de uma tabela de freqüências. Por exemplo, em um conjuntode dados contínuos, um mesmo valor não ocorrerá com grande freqüência, ou até mesmo,não se repetirá por mais de uma vez. Uma vantagem em agrupar os dados em classesconsiste na organização de grandes conjuntos de dados de forma mais clara e objetiva.Por outro lado, uma desvantagem, consiste na perda de informações por não se saberexatamente quais os valores ocorridos dentro de cada classe.

Para ilustrar como proceder a construção de uma tabela de freqüências em classes,considere o seguinte conjunto de dados:

Tabela 2: Dados referentes às notas no 1o estágio de 20 estudantes de estatística.

Código do aluno 1 2 3 4 5 6 7 8 9 10Nota 7,5 8,0 9,0 7,3 6,0 5,8 10,0 3,5 4,0 6,0Código do aluno 11 12 13 14 15 16 17 18 19 20Nota 7,5 7,0 8,5 6,8 9,5 9,8 10,0 4,8 5,5 7,0

Note que, não haverá vantagem alguma se organizarmos estes dados numa tabela defreqüências, uma vez que os dados pouco se repetem. Assim, torna-se útil o agrupamentodos dados, que, de um modo geral, pode ser feito de acordo com os seguintes passos:

1. Organizar os dados num Rol.

10

Page 11: Probab Il i Dade

2. Estabelecer o Número de Intervalos (categorias ou classes) para se dividir o con-junto de dados.

A escolha do número de classes é arbitrária, a qual pode ser estabelecida de acordocom o bom senso do pesquisador ou obtido por alguma fórmula matemáticaconstruída para este fim. Uma sugestão prática é a escolha entre 5 e 15 classes coma mesma amplitude e duas fórmulas matemáticas que podem orientar na escolha donúmero de classes, são:

(a) k =√

n

(b) k = 1 + 3, 3 × log(n)

Onde k é o número de classes e n é o número total de observações.

3. Calcular a Amplitude Total:

ATot = xmax − xmin

Onde xmax e xmin é o valor máximo e mínimo observado no conjunto de dados.

4. Determinar a Amplitude de Classe:

h =ATot

k

5. A partir do menor valor observado no conjunto de dados, ou de algum valor imedia-tamente inferior e adequadamente escolhido, delimitar as classes, ou seja, determinaros limites inferiores e superiores de cada classe.

Neste momento, os seguintes símbolos são úteis:

(a) li −−−−| Li - para indicar que o valor extremo inferior (li) não pertenceà i-ésima classe, enquanto que o valor extremo superior (Li) pertence.

(b) li |−−−− Li - para indicar que o valor extremo inferior (li) pertence ài-ésima classe, enquanto que o valor extremo superior (Li) não pertence.

6. Após todos estes passos, só resta proceder a contagem do número de observaçõespertencentes à cada uma das classes e organizar estas informações numa tabela defreqüências para dados agrupados.

De acordo com estes passos, o conjunto de dados anterior pode ser organizado como:

11

Page 12: Probab Il i Dade

(Construir a tabela de freqüências para dados agrupados)

Representação Gráfica de uma Variável Quantitativa Contínua - Histograma

Para a representação gráfica de variáveis quantitativas contínuas é necessário algumaadaptação do gráfico de colunas, uma vez que, em geral, é necessário agrupar os dados emclasses e conseqüentemente há perda de informações.

Histograma - é um gráfico indicado para representar dados agrupados em classes.Este gráfico é uma adaptação do gráfico de colunas, onde as bases correspondem aosintervalos de classe e as alturas são proporcionais às freqüências de classe. Veja como ficao histograma para a distribuição das notas:

(Construir o histograma para a distribuição de freqüências em classes)

12

Page 13: Probab Il i Dade

Exercícios de Fixação

1 - Segue abaixo os dados da variável taxa de mortalidade infantil de 34 municípios:

32,3 62,2 10,3 22,0 13,1 9,9 11,9 20,0 36,4 23,518,0 22,6 20,3 38,3 19,6 27,2 28,9 18,4 27,3 21,723,7 13,9 36,3 32,9 29,7 25,4 23,8 15,7 17,0 39,222,7 29,9 18,3 33,0

Obtenha uma distribuição de frequências com 7 classes, começando do valor 0 (in-cluso) e com amplitudes de classe iguais a 10. Apresente alguns comentários sobre ataxa de mortalidade infantil dos 34 municípios.

2 - Em uma pesquisa foram anotados os tempos decorridos entre a incidência de umacerta doença e sua cura, em 50 pacientes. Estes tempos são os seguintes, em horas:

21 44 27 323 99 90 20 66 39 1647 96 127 74 82 92 69 43 33 1241 84 02 61 35 74 02 83 03 1341 10 24 24 80 87 40 14 82 5816 35 114 120 67 37 126 31 56 04

Construa um histograma e comente sobre alguns aspectos relevantes desta distribui-ção.

13

Page 14: Probab Il i Dade

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus IUNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICADisciplina: Probabilidade e Estatística (6 créditos) Período 2009.2Prof. Gilberto Matos e Areli MesquitaAluno(a): .

3a NOTA DE AULA

2.3 Medidas Resumo para Variáveis Quantitativas

Nesta seção veremos algumas medidas que tem como objetivo resumir um conjuntode dados em um único valor o qual possa fornecer informações sobre o comportamento dosdados, ou seja, sobre a distribuição de freqüências da variável.

2.3.1 Medidas de Tendência Central

As medidas de tendência central são bastante utilizadas e representam o centro ou omeio de um conjunto de dados. As principais são: a mediana, a moda, e a média aritmética.

A seguir estas medidas são definidas e obtidas para os dois seguintes conjuntos dedados que representam o número de gols registrados em cada partida de futebol, durante5 e 6 jogos, respectivamente:

Conjunto de dados 1: Número de gols por partida de futebol, em 5 jogos.

3 2 1 2 5

Conjunto de dados 2: Número de gols por partida de futebol, em 6 jogos.

5 3 2 1 2 5

1. Mediana - é o valor que divide o conjunto de dados ordenados em duas partesiguais, ou seja, 50% das unidades observadas possuem valores menores ou iguais aovalor mediano e as demais 50% possuem valores acima da mediana.

Para se obter o valor da mediana é necessário os seguintes passos:

1) Ordenar o conjunto de dados em ordem crescente (ou descrescente);

2) Identificar a posição central do conjunto de dados, ou seja, a posição ondese encontra o valor da mediana. Esta(s) posição(ões) pode(m) ser verificada(s)utilizando-se as seguintes fórmulas:

(a) PMd = n+12

, se o total de observações, n, é ímpar. Assim, a mediana seráo valor observado na posição PMd;

(b) P1Md = n2

e P2Md = n2+1, se o total de observações, n, é par. Pois, neste

caso, existem duas posições centrais e a mediana será a média aritmética dosvalores observados nestas duas posições.

Notação: Md ou Md(X).

14

Page 15: Probab Il i Dade

Exemplo 1: A partir do conjunto de dados 1, pode-se obter o seguinte rol de dados:

1 2 2︸︷︷︸

mediana

3 5

Note que, o número de observações, n = 5, é ímpar, logo o valor da mediana (valorcentral) está na posição PMd = n+1

2= 5+1

2= 3, que é igual a Md = 2.

Exemplo 2: Ordenando em ordem crescente o conjunto de dados 2, teremos oseguinte rol de dados:

1 2 2 3︸︷︷︸

dois valores centrais

5 5

Agora, neste caso, o número de observações, n = 6, é par, e, portanto, existem doisvalores centrais localizados nas posições P1Md = n

2= 6

2= 3 e P2Md = n

2+ 1 =

3 + 1 = 4. Assim, a mediana será a média aritmética dos valores que se encontramnestas duas posições, dada por:

Md =xP1Md

+ xP2Md

2=

2 + 3

2= 2, 5.

Observação:

Pode-se, também, obter a posição da mediana através dos seguintes passos:

1) Obter o valor que representa a metade do total de observações: PMd = n2;

2) Utilizar a seguinte regra:

(a) Se PMd for um número não inteiro, então, arredonda-se o valor de PMd parao maior inteiro mais próximo, e, assim, o valor da mediana estará nesta novaposição obtida.

(b) Se PMd for um número inteiro, então o valor da mediana será a média aritméticados valores que estão nas posições PMd e PMd + 1.

Exemplo 3: Utilizando-se os procedimentos descritos na observação acima, temosque, para o conjunto de dados 1, PMd = n

2= 5

2= 2, 5 (não inteiro), logo o valor da

mediana estará na posição PMd = 3 (maior inteiro mais próximo), que é dado porMd = 2.

Exemplo 4: No conjunto de dados 2, temos PMd = n2

= 62

= 3 (inteiro), assim, deacordo com o procedimento descrito na observação acima, temos que a mediana édada pela média aritmética dos valores observados nas posições PMd = 3 e PMd+1 =3 + 1 = 4:

Md =xP1Md

+ xP2Md

2=

2 + 3

2= 2, 5.

15

Page 16: Probab Il i Dade

2. Moda - é o valor (ou os valores) no conjunto de dados que ocorre(m) com maiorfreqüência.

Notação: Mo ou Mo(X).

Exemplo 5: O primeiro conjunto de dados, 1 2 2 3 5, é dito ser unimodal,tendo em vista que um único valor ocorre com maior frequência. Assim, a moda éMo = 2.

Exemplo 6: O segundo conjunto de dados, 1 2 2 3 5 5, é dito ser bimodal,tendo em vista que, neste caso, dois valores ocorrem com maior frequência, assim,os valores modais são: Mo = 2 e Mo = 5.

3. Média Aritmética (Média) - é obtida a partir da razão entre a soma dos valoresobservados e o total de observações:

Média =soma dos valores

total de observações (n)

Notação: Me, Me(X) ou x.

Exemplo 7: A partir do conjunto de dados 1, a média é obtida por:

Me(X) = x =soma dos valores

total de observações (n)=

1 + 2 + 2 + 3 + 5

5= 2, 6.

Observação:

1) A média aritmética pode ser expressa através do uso do símbolo de somatório∑

(sigma). Por exemplo, se x1, x2, . . . , xk são k valores distintos da variável X,podemos escrever:

Me(X) = x =x1 + x2 + . . . + xk

k=

1

k

k∑

i=1

xi

Agora, se, de um total de n valores observados (ou observações), x1 ocorreu n1 vezes,x2 ocorreu n2 vezes, etc., xk ocorreu nk vezes, então a média de X pode ser reescritacomo:

Me(X) = x =x1.n1 + x2.n2 + . . . + xk.nk

n=

1

n

k∑

i=1

xi.ni (1)

=k∑

i=1

xi.ni

n(2)

=

k∑

i=1

xi.fi. (3)

Onde:

16

Page 17: Probab Il i Dade

• ni é freqüência absoluta do valor observado xi,

• n =∑k

i=1 ni é o total de observações, e,

• fi é freqüência relativa do valor observado xi.

Exemplo 8: A partir do segundo conjunto de dados, 1 2 2 3 5 5, temos:

Me(X) = x =1

n

k∑

i=1

xi.ni =1

6(1 × 1 + 2 × 2 + 3 × 1 + 5 × 2) =

18

6= 3.

Exercícios de Fixação

1 - Dado o seguinte conjunto de dados:

12 12 15 15 15 17 18 18 18 18 19 20

Determine a média, moda e mediana.

Solução:

17

Page 18: Probab Il i Dade

2.3.2 Medidas de Posição: Quartis, Decis e Percentis

Assim como a mediana divide os dados em duas partes iguais, os três quartis, denota-dos por Q1, Q2 e Q3, dividem as observações ordenadas (em ordem crescente) em quatropartes iguais. A grosso modo:

- Q1 separa os 25% inferiores dos 75% superiores dos valores ordenados;

- Q2 separa os 50% inferiores dos 50% superiores, ou seja, é a mediana; e

- Q3 separa os 75% inferiores dos 25% superiores dos dados;

Analogamente, há nove decis, denotados por D1, D2, . . . , D9, que dividem os dadosem 10 grupos com cerca de 10% deles em cada grupo. Finalmente, há 99 percentis quedividem os dados em 100 grupos com cerca de 1% em cada grupo.

Basicamente, dois passos são necessários para se encontrar as medidas em questão.Primeiro deve-se identificar a sua posição, e, em seguida, determinar o seu valor.

Veja a seguir, como obter os valores referentes aos percentis, quando se está traba-lhando com dados brutos ou em distribuição de freqüências para dados não agrupados:

1) Identificar a posição do percentil que se deseja encontrar, através da seguinteexpressão:

L =

(k

100

)

× n

Onde:

- L é o valor que indica a posição do percentil de interesse;

- k é o k − esimo percentil; e

- n é o total de dados observados.

2) Utilizar a seguinte regra:

1. Se L for um número não inteiro, então, arredonda-se o valor de L para o maiorinteiro mais próximo, e, assim, o valor do k − esimo percentil, Pk, é dado pelo valorque ocupa esta nova posição obtida.

2. Se L for um número inteiro, então o valor do k− esimo percentil, Pk, será a médiaaritmética dos valores que estão nas posições L e L + 1.

Uma vez dominados os cálculos para os percentis, pode-se seguir o mesmo processopara calcular os quartis e decis, tendo-se o cuidado de calcular o valor de L, pelas fórmulasL =

(k4

)× n, k = 1, 2, 3 e L =

(k10

)× n, k = 1, 2, . . . , 9, respectivamente. Pode-se,

ainda, obter os quartis e decis pelas seguintes relações existentes entre estas medidas e ospercentis:

18

Page 19: Probab Il i Dade

Quartis DecisQ1 = P25 D1 = P10

Q2 = P50 D2 = P20

Q3 = P75...

D9 = P90

Exercícios de Fixação

1 - Dado o seguinte conjunto de dados:

12 12 15 15 15 17 18 18 18 18 19 20

Determine os Quartis.

Solução:

19

Page 20: Probab Il i Dade

2.3.3 Medidas de Dispersão ou de Variabilidade

Na sumarização de um conjunto de dados, uma única medida representativa da posiçãocentral, esconde toda a informação sobre a variabilidade dos dados. Veja, por exemplo, osseguintes dados:

Variável X : 3 4 5 6 7

Variável Y : 4 5 5 6

Variável Z : 5 5 5 5

Note que a média Me(X) = Me(Y ) = Me(Z) = 5, a qual nada informa sobre avariação dos valores nos dois grupos. Assim, torna-se importante o conhecimento de umamedida que forneça este tipo de informação.

Na prática, existem várias medidas que expessam a variabilidade de um conjunto dedados, sendo que as mais utilizadas baseam-se na idéia que consiste em verificar a distânciade cada valor observado em relação à média. Estas distâncias são denominadas de desviosem relação à média.

Definição 2.1 (Variância). - é uma medida que representa a variabilidade de um

conjunto de dados e, é obtida pelo cálculo da média dos quadrados dos desvios emrelação à média:

V ar(X) = s2

=1

n

k∑

i=1

(xi − x)2 × ni

=

k∑

i=1

(xi − x)2 × ni

n

=

k∑

i=1

(xi − x)2 × fi

Exercício

1. Mostre que:k∑

i=1

(xi − x)2 × ni =

k∑

i=1

x2i ni − nx2

E, por isso, a variância também pode ser obtida pela seguinte fórmula:

V ar(X) = s2 =1

n

k∑

i=1

x2i ni − x2

20

Page 21: Probab Il i Dade

Vejamos, agora, como fica a variância para as variáveis X, Y e Z:

Assim, de acordo com a variância, podemos dizer que a variável X apresenta ...

Observação: Para o cálculo da variância, quando os dados estão agrupados emclasses, basta substituir os verdadeiros valores observados xi pelo ponto médio da i-ésimaclasse si.

Definição 2.2 (Desvio Padrão). - é a raiz quadrada da variância.

D.P.(X) = s =√

s2 =

√√√√

k∑

i=1

(xi − x)2 × fi

O uso do desvio padrão como medida de variabilidade é preferível pelo fato de serexpresso na mesma unidade de medida dos valores observados. Pois, a variância podecausar problemas de interpretação por ser expressa em termos quadráticos.

Definição 2.3 (Coeficiente de Variação). - O coeficiente de variação (CV) é

uma medida relativa de variabilidade. O seu valor é determinado por intermédio doquociente entre o desvio padrão e a média aritmética dos dados.

CV (X) =s

x× 100 (expresso em porcentagem (%))

A utilidade imediata do coeficiente de variação é a possibilidade de avaliar o graude representatividade da média. Esta medida também é bastante útil na comparaçãoentre conjunto de dados, em relação à variabilidade; ainda que as unidades de medida nosconjuntos de dados sejam distintas. Por exemplo, comparar a variabilidade das distribuiçõesda variável peso expressa em quilogramas (Kg) e altura expressa em metros (m).

Um critério de decisão sobre a representatividade ou não da média, pode ser dada pelaseguinte linha de corte:

Se CV ≥ 50%, a média não é representativa.Se CV < 50%, a média é representativa.

21

Page 22: Probab Il i Dade

Exemplos:

a) Obtenha o desvio padrão das variáveis X, Y e Z além dos coeficientes de variaçãoCV (X), CV (Y ) e CV (Z).

b) Considere os quilômetros rodados por 3 carros: 30 Km, 40 Km e 50 Km. Calculea média, a variância, o desvio padrão e o CV. Interprete essas medidas.

Exercícios de Fixação

1 - Dado o seguinte conjunto de dados:

12 12 15 15 15 17 18 18 18 18 19 20

Determine o desvio padrão e o CV.

Solução:

22

Page 23: Probab Il i Dade

2.3.4 Medidas Resumo para Dados Agrupados

Sabemos que ao agrupar um conjunto de dados em classes, perde-se informação sobrecada valor individual e, no caso em que seja impossível recuperar cada valor observado,pode-se supor que todos os dados dentro de uma classe tenham seus valores iguais aoponto médio desta classe que denotaremos por si. Assim, pode-se, por exemplo, utilizaros pontos médios das classes si e suas respectivas freqüências ni para calcular a médiaaritmética de maneira análoga ao exposto anteriormente. Da mesma forma, pode-se adotarcomo valor modal, o ponto médio da classe modal e como mediana, o ponto médio daclasse mediana.

Exemplo: Dada a seguinte distribuição de freqüência da variável S=salário (dadosagrupados em classes):

Salário ni

4, 00 ⊢ 8, 00 108, 00 ⊢ 12, 00 1212, 00 ⊢ 16, 00 816, 00 ⊢ 20, 00 820, 00 ⊢ 24, 00 2

Determine o valor (aproximado) da média, moda e mediana. Determine também odesvio padrão e o CV. Determine a mediana aproximada usando o histograma. Determine,ainda, os quartis aproximados pelos pontos médios de classe e usando o histograma.

Solução:

23

Page 24: Probab Il i Dade

2.4 Outra Estratégia de Análise de Dados

Em algumas situações a média e o desvio padrão podem não ser adequados pararepresentar um conjunto de dados, pois:

i - São afetadas, de forma exagerada, por valores extremos;

ii - Apenas com estes dois valores não temos a idéia da assimetria dos valores, ou seja,sobre o quanto os dados se distribuem em torno dos valores inferiores, medianos esuperiores.

Para contornar estes problemas, 5 medidas foram sugeridas por Tukey (1977):

1) A mediana (Md);

2) Os extremos: o menor e o maior valor observado no conjunto de

dados (xmin e xmax, respectivamente);

3) O primeiro e o terceiro quartil (ou junta).

2.4.1 Desenho Esquemático - Diagrama em Caixa ("Box-Plot")

As informações obtidas pelas 5 medidas podem ser representadas por um gráfico co-nhecido por "Box-Plot"ou diagrama em caixa. Para construir este diagrama, consideremosum retângulo onde estão representados a mediana e os quartis. A partir do retângulo,para cima, segue uma linha até o ponto mais remoto que não exceda LS = Q3 + (1, 5)dq,chamado limite superior, onde dq representa a distância entre o primeiro e o terceiro quartil.De modo similar, da parte inferior do retângulo, para baixo, segue uma linha até o pontomais remoto que não seja menor do que LI = Q1 − (1, 5)dq, chamado limite inferior.Os valores compreendidos entre esses dois limites são chamados valores adjacentes. Asobservações que estiverem acima do limite superior ou abaixo do limite inferior estabelecidosserão chamadas pontos exteriores e representadas por asteriscos. Essas são observaçõesdestoantes das demais e podem ou não ser o que chamamos de outliers ou valoresatípicos.

O box plot dá uma idéia da posição, dispersão, assimetria, caudas e dados discrepan-tes. A posição central é dada pela mediana e a dispersão por dq. As posições relativas deQ1, Q2, Q3 dão uma noção da assimetria da distribuição.

Veja, como fica o box-plot da variável Peso apresentado na Figura 3.

Gráficos tipo box-plot também são úteis para detectar, descritivamente, diferençasnos comportamentos de grupos de variáveis. Por exemplo, podemos considerar gráficos davariável Peso para cada sexo. O resultado é apresentado na Figura 4, em que podemosnotar que os homens apresentam peso mediano superior ao das mulheres, além de umamaior variabilidade.

24

Page 25: Probab Il i Dade

Figura 3: Box-plot para a variável Peso

Figura 4: Box-plot da variável Peso para cada sexo

25

Page 26: Probab Il i Dade

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus IUNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICADisciplina: Probabilidade e Estatística (6 créditos) Período 2009.2Prof. Gilberto Matos e Areli MesquitaAluno(a): .

2a LISTA DE EXERCÍCIOS

1 - Considere uma distribuição de freqüências qualquer representada por

(x1, n1), (x2, n2), . . . , (xk, nk).

Mostre que a soma dos desvios em relação à média é igual zero, ou seja, que∑k

i=1(xi − x) × ni = 0.

2 - Obtenha a média e a mediana para o seguinte conjunto de dados:

20 30 40

a) Se substituímos o valor 40 por 70, os valores da média e da mediana serão osmesmos? Justifique?

b) Analisando os resultados acima, ressalte uma característica vantajosa da medi-ana em relação à média.

3 - Na turma A do curso normal da Escola X, estão matriculados 50 alunos no cor-rente ano. O levantamento das fichas biométricas revelou as seguintes estaturas emcentímetros:

165 164 151 160 155 169 153 156 165 160

170 157 162 162 155 154 151 155 162 150

168 160 154 151 168 155 156 158 166 155

154 152 163 156 170 158 171 159 175 154

159 158 153 158 156 162 165 156 161 157

a) Elabore uma distribuição de freqüências, fazendo o limite inferior da primeira classeigual a 150 (inclusive) e amplitudes dos intervalos de classe igual a 5 cm.

b) Baseado na distribuição de freqüência calcule: a média, a mediana e a moda.

4 - As taxas de juros recebidas por 10 ações durante certo período foram (medidas emporcentagem): 2.59; 2.64; 2.60; 2.62; 2.57; 2.55; 2.61; 2.50; 2.63; 2.64. Calcule amédia e a mediana.

26

Page 27: Probab Il i Dade

5 - Dados os conjuntos de números: A = 1000; 1001; 1002; 1003; 1004; 1005 e B =0, 1, 2, 3, 4, 5 podemos afirmar que:

a) o desvio-padrão de A é igual a 100 vezes o desvio-padrão de B.

b) o desvio-padrão de A é igual ao desvio-padrão de B.

c) o desvio-padrão de A é igual ao desvio-padrão de B multiplicado pelo quadrado de1000.

d) o desvio-padrão de A é igual ao desvio-padrão de B dividido por 1000.

e) o desvio-padrão de A é igual ao quadrado do desvio-padrão de B.

27

Page 28: Probab Il i Dade

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus IUNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICADisciplina: Período

Aluno(a): .

4a NOTA DE AULA

3 Análise Bidimensional

3.1 Introdução

Em algumas análises de dados pode surgir a necessidade de se fazer um estudo sobreo comportamento conjunto de duas ou mais variáveis e para isso a distribuição conjunta defreqüências é de grande utilidade.

Na presente nota de aula estudaremos apenas o caso de duas variáveis e, sendo assim, épossível observar a ocorrência de três situações distintas que requerem técnicas estatísticastambém distintas. As três situações distintas que podem ocorrer são:

• As duas variáveis são Qualitativas;

• As duas variáveis são Quantitativas;

• Uma variável é Qualitativa e a outra Quantitativa.

Na presente nota de aula, estudaremos apenas os dois primeiros casos.

3.2 Associação entre duas variáveis qualitativas

Para ilustrar como podemos realizar uma análise sobre a associação entre duas variáveisqualitativas, veremos, por exemplo, como se comportam as variáveis: região de procedência(X) e grau de instrução (Y ) cuja distribuição de freqüências pode ser representada por umatabela de dupla entrada.

Tabela 1 - Distribuição de freqüências conjunta das variáveis X e Y .

Y 1 Grau 2 Grau Superior Total marginal de XXCapital 4 5 2 11Interior 3 7 2 12Outra 5 6 2 13Total marginal de Y 12 18 6 36

28

Page 29: Probab Il i Dade

Observações:

1. Cada célula do corpo da tabela apresenta o número de ocorrência simultânea dosvalores (x, y) de X e Y , constituindo a distribuição conjunta;

2. A coluna dos totais (freqüências marginais de X) constitui a distribuição marginal deX;

3. A linha dos totais (freqüências marginais de Y ) constitui a distribuição marginal deY ;

4. Assim como no caso de uma única variável, as freqüências absolutas podem serexpressas em termos de freqüências relativas e/ou porcentagens, sendo que, estasmedidas podem ser obtidas em relação ao total geral, em relação ao total de cadalinha ou em relação ao total de cada coluna, de acordo com o objetivo de cadaanálise;

Exercício de Fixação

A partir dos dados apresentados na Tabela 1, determine:

a) O percentual de pessoas que possuem o 2 grau e que são do interior. R: 19%.;

b) Dentre os que possuem o 2 grau, qual é o percentual de pessoas provenientes dointerior? R: 39%;

c) Sabendo-se que uma pessoa veio do interior, qual é a probabilidade, em termospercentuais, de ter o 2 grau? R: 58,3%.

Para responder estas e outras questões, torna-se útil a construção de tabelas de duplaentrada contendo as freqüências relativas em termos de porcentagem, tendo como referênciao total geral, os totais de cada linha ou coluna, de acordo com a questão a ser respondida.Vejamos como ficam estas tabelas:

Tabela 2 - Freqüências percentuais da distribuição conjunta das variáveis X e Y , emrelação ao total de dados observados.

Y 1 Grau 2 Grau Superior Total marginal de XXCapitalInteriorOutraTotal marginal de Y 100%

29

Page 30: Probab Il i Dade

Tabela 3 - Freqüências percentuais da distribuição conjunta das variáveis X e Y , emrelação ao total de linha (freqüência marginal de X).

Y 1 Grau 2 Grau Superior Total marginal de XXCapital 100%Interior 100%Outra 100%Total marginal de Y 100%

Tabela 4 - Freqüências percentuais da distribuição conjunta das variáveis X e Y , emrelação ao total de coluna (freqüência marginal de Y ).

Y 1 Grau 2 Grau Superior Total marginal de XXCapitalInteriorOutraTotal marginal de Y 100% 100% 100% 100%

3.3 Independência de Variáveis

Ocorre com bastante freqüência em análises de distribuição conjunta o questionamentosobre a existência de dependência ou não entre as variáveis, além da necessidadede se saber o grau de dependência entre elas, caso exista.

De modo geral, o grau de dependência entre duas variáveis é quantificado pelos co-eficientes de associação ou correlação. Usualmente, esses coeficientes variam de zero atéum, sendo que, às vezes, variam de -1 a 1. Desta maneira, valores próximos de zero dãoindícios de independência entre as variáveis e, valores próximos de 1 (ou -1) indicam umalto grau de dependência positiva (ou negativa).

3.3.1 Medidas de Associação entre duas Variáveis Qualitativas

Uma medida de dependência bastante utilizada para variáveis qualitativas é o coeficientede contingência, o qual é dado por

C =

χ2

χ2 + n,

onde n é o número de observações e χ2 é uma medida conhecida por qui-quadrado, a qualé obtida a partir da seguinte soma

30

Page 31: Probab Il i Dade

χ2 =

r∑

i=1

s∑

j=1

(oij − eij)2

eij

,

onde o somatório é estendido a todas as caselas de frequências conjuntas em uma tabelade dupla entrada, e

• oij é a freqüência observada na i-ésima casela;

• eij é a freqüência esperada na i-ésima casela, caso houvesse independência entre asvariáveis, ou seja, quando a proporção em cada categoria de uma variável (fixada ototal em linha ou coluna) é igual ou próxima a proporção marginal. No entanto, ovalor máximo de C depende de r e s e, para evitar esse inconveniente, costuma-sedefinir um outro coeficiente, que varia entre 0 e 1, dado por

T =

χ2/n

(r − 1)(s − 1).

3.3.2 Medidas de Associação entre duas Variáveis Quantitativas

Neste caso, pode-se aplicar um procedimento análogo ao realizado para a análise de variáveisqualitativas. E, por se tratar de variáveis quantitativas, antes de construir uma tabela dedupla entrada, os dados marginais podem ser agrupados em intervalos de classe, assim comono caso de uma única variável. Em análises de associação entre variáveis quantitativas, sãopossíveis procedimentos analíticos mais refinados, como veremos a seguir.

Diagrama de Dispersão

O diagrama (ou gráfico) de dispersão nada mais é que a representação de pares dosvalores observados (x, y) num sistema cartesiano. Vejamos a ilustração de alguns gráficosque podem surgir na prática:

31

Page 32: Probab Il i Dade

Coeficiente de Correlação (Linear)

Ao ser observada uma associação entre variáveis quantitativas, seria muito útil saber-mos sobre a intensidade desta associação. Aqui, veremos apenas uma medida referenteao tipo de associação linear, ou seja, ao tipo de relação em que os pontos do gráfico dedispersão aproximam-se de uma reta.

Definição: Dados n pares de valores (x1, y1), (x2, y2), ..., (xn, yn), chama-se coefici-ente de correlação entre as variáveis X e Y o valor obtido por

corr(X, Y ) =1

n

n∑

i=1

(xi − x)(yi − y)

dp(X)dp(Y )

ou seja, a média dos produtos dos valores reduzidos (ou padronizados) das variáveis.

Enquanto o coeficiente T para variáveis qualitativas só assume valores ente 0 e 1, ocoeficiente de correlação pode assumir qualquer valor entre -1 e 1. Uma fórmula alternativae mais operacional para o coeficiente de correlação é dada por

corr(X, Y ) =

∑xiyi − nxy

(∑

x2i − nx2)(

∑y2

i − ny2)

O numerador da expressão acima, que mede o total de concentração dos pontos pelosquatro quadrantes, dá origem à covariância que é uma medida bastante usada.

Definição: Dados n pares de valores (x1, y1), (x2, y2), ..., (xn, yn), chamamos de co-variância entre as variáveis X e Y à medida dada por

cov(X, Y ) =n∑

i=1

(xi − x)(yi − y)

n.

Ou seja, a média dos produtos dos valores centrados das variáveis.

Alternativamente o coeficiente de correlação também pode ser escrito como

corr(X, Y ) =cov(X, Y )

dp(X)dp(Y ).

Exercício de Aplicação

Numa amostra de cinco operários de uma dada empresa foram observadas duas variá-veis. X: anos de experiência num dado cargo e Y: tempo, em minutos, gasto na execução deuma tarefa relacionada com esse cargo. As observações são apresentadas na tabela abaixo.

X 1 2 4 4 5Y 7 8 3 2 2

Obs.:∑

x = 16,∑

x2 = 62,∑

y = 22,∑

y2 = 130,∑

xy = 53.

Você diria que a variável X pode ser usada para explicar a variação de Y? Justifique.

32

Page 33: Probab Il i Dade

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus IUNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICADisciplina: Probabilidade e Estatística (6 Créditos) Período 2009.2Professores: Gilberto Matos e Areli Mesquita

Relação de Exercícios para o 1 Estágio

Livro: "Estatística Básica"Autores: Wilton O. Bussab e Pedro A. Morettin

Capítulo 1 (4a. Edicão - Antiga) / Capítulo 2 (5a. Edicão - Nova):

4a. Edicão - Antiga 5a. Edicão - NovaProblema Página Problema Página

2 8 2 153 e 4 15 4 e 5 22

6 16 7 227 16 9 269 19 11 28

Capítulo 2 (4a. Edicão - Antiga) / Capítulo 3 (5a. Edicão - Nova):

4a. Edicão - Antiga 5a. Edicão - NovaProblema Página Problema Página

Do 1 ao 4 40 e 416 41

Do 14 ao 22 58 a 6123 e 24 61 e 6226 e 27 62 e 63

29 6440 66

Capítulo 3 (4a. Edicão - Antiga) / Capítulo 4 (5a. Edicão - Nova):

4a. Edicão - Antiga 5a. Edicão - NovaProblema Página Problema Página

1, 2, 3 734 e 6 76

9 8018 a 21 95

22 9629 e 30 97 e 98

33

Page 34: Probab Il i Dade

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus IUNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICADisciplina: Probabilidade e Estatística (6 créditos) Período 2009.2Prof. Gilberto Matos e Areli MesquitaAluno(a): .

5a NOTA DE AULA

4 Introdução à Probabilidade

Objetivo: Definir um modelo matemático probabilístico que seja conveniente a descriçãoe interpretação de fenômenos aleatórios.

4.1 Introdução

Ao jogarmos uma moeda para o ar, de modo geral, não podemos afirmar se ocorrerácara ou coroa. Da mesma forma, quando lançamos um dado não sabemos qual das faces1, 2, 3, 4, 5, ou 6 ocorrerá. No campo dos negócios e do governo há numerosos exemplosde tais situações. Por exemplo, a incerteza existe quando desejamos realizar uma previsãosobre a procura de um novo produto, a opinião pública em relação a determinado assunto,o sucesso de um novo plano econômico, etc - tudo isso contém algum elemento de acaso.

Na Estatística, a incerteza existe quando se quer fazer alguma afirmação a respeito dealguma característica populacional baseada em informações extraídas de dados amostrais.Neste caso, a aplicação da Teoria das Probabilidades é de fundamental importânciapara a solução de problemas de Inferência Estatística.

Independente de qual seja a aplicação em particular, a utilização das probabilidadesindica que existe um elemento de acaso, ou de incerteza, quanto à ocorrência ou não de umevento futuro. Assim é que em muitos casos, pode ser impossível afirmar com antecipaçãoo que ocorrerá. No entanto, é possível dizer o que pode ocorrer.

O ponto central em todas essas situações é a possibilidade de quantificar quão provávelé determinado evento.

Em suma, podemos dizer que, as probabilidades são utilizadas para exprimir a chancede ocorrência de determinado evento.

34

começo
Page 35: Probab Il i Dade

4.2 Definições Básicas

Definição 4.1 (Experimentos Aleatórios ou Fenômenos Aleatórios). são aque-

les onde o processo de experimentação está sujeito a influências de fatores casuais econduz a resultados incertos.

Notação: E.

Exemplos:

E1 : Jogar uma moeda e observar a face superior.

E2 : Lançar um dado e observar o número da face superior.

E3: Uma lâmpada é fabricada. Em seguida é testada a duração da vida útil dessalâmpada.

Observações:

a) Cada experimento poderá ser repetido um grande número de vezes sob as mesmascondições;

b) Não podemos afirmar que resultado particular ocorrerá, porém podemos descrevero conjunto de todos os possíveis resultados do experimento;

c) Quando o experimento é repetido um grande número de vezes, surgirá uma regula-ridade nos resultados. Esta regularidade, chamada de regularidade estatística, é que tornapossível construir um modelo matemático preciso com o qual se analisará o experimento.

Definição 4.2 (Espaço Amostral). é o conjunto de todos os possíveis resultados de

um experimento aleatório.

Notação: S ou Ω.

Exemplos:

Os espaços amostrais associados aos experimentos aleatórios E1, E2 e E3 são:

S1 =

S2 =

S3 =

35

Page 36: Probab Il i Dade

Definição 4.3 (Evento). Dado um espaço amostral S associado a um experimento E,

definimos como evento, qualquer subconjunto desse espaço amostral, ou seja, é qualquercoleção de resultados do experimento E.

Notação: A, B, C, D, etc.

Exemplos:

1 - Considerando o espaço amostral S2, exemplos de eventos seriam:

A: Ocorre face par =

B: Ocorre um número menor que 4 =

C: Ocorre um número maior que 0 =

D: Ocorre o número 10 =

2 - Considerando o espaço amostral S3, um exemplo de evento seria:

A: A vida útil de uma lâmpada é menor que 10 horas =

Observação:

Como os eventos de um espaço amostral são conjuntos, todas as operações da teoriados conjuntos são válidas para obter novos eventos. Considere, por exemplo, dois eventosA e B, então o evento:

a) A ∪ B ocorrerá se, e somente se, A ocorrer, ou B ocorrer, ou ambos ocorrerem;

b) A ∩ B ocorrerá se, e somente se, A e B ocorrerem simultaneamente;

c) A ocorrerá se, e somente se, A não ocorrer;

Um recurso gráfico, conhecido como Diagrama de Venn, poderá ser vantajosamenteempregado quando estivermos combinando conjuntos. Para ilustrar, vejamos como ficaeste diagrama representando os eventos descritos nos itens a, b e c:

(Desenhar os Diagramas de Venn, para cada evento)

36

Page 37: Probab Il i Dade

Definição 4.4 (Eventos Mutuamente Excludentes). Dois eventos, A e B, são

denominados, mutuamente excludentes, se eles não puderem ocorrer simultaneamente,ou seja, A ∩ B = φ.

Exercício: Esboce um Diagrama de Venn, representando dois eventos mutuamente exclu-dentes.

Exemplo: Ao lançar um dado e observar o número da face superior temos que oevento A: observar face par é mutuamente excludente do evento B: observar face ímpar,pois é impossível observar a ocorrência simultânea destes dois eventos, ou seja, A∩B = φ.

Observação: Leis de D’Morgan

(i) A ∪ B = A ∩ B

(ii) A ∩ B = A ∪ B

Exemplos:

1 - Lança-se um dado e observa-se o número da face superior. Considerando este expe-rimento aleatório e os eventos:

A: Ocorre face par =

B: Ocorre um número menor que 4 =

Determine em notação de conjuntos os seguintes eventos:

a) C: ocorre face menor que 7 =

b) D: ocorre face cujo valor é maior que 6 =

c) A ∪ B

d) A ∩ B

e) A

f) B

g) A ∪ B

h) A ∩ B

i) A ∪ B

j) A ∩ B

k) A − B = A ∩ B

l) B − A = B ∩ A

37

Page 38: Probab Il i Dade

4.3 Abordagens para Definir Probabilidade

4.3.1 Aproximação da Probabilidade pela Freqüência Relativa - (Lei dosGrandes Números)

Definição 4.5 (Freqüência Relativa). Suponha que um experimento é repetido n vezes,

e seja A e B dois eventos associados ao experimento. Sejam nA e nB o número devezes que o evento A e o evento B ocorram nas n repetições. A freqüência relativa doevento A, representada por fA, é definida como

fA =nA

n.

Propriedades:

(i) 0 ≤ fA ≤ 1;

(ii) fA = 1, se, e somente se, A ocorrer em todas as n repetições;

(iii) fA = 0, se, e somente se, A nunca ocorrer nas n repetições;

(iv) Se A e B forem eventos mutuamente excludentes, e se fA∪B for a freqüênciarelativa associada ao evento A ∪ B, então,

fA∪B = fA + fB.

Teorema 4.1 (Lei dos Grandes Números). Ao repetir um experimento um grandenúmero de vezes, a probabilidade de um evento A é aproximada pela freqüência relativa,isto é,

P (A) ∼= fA =nA

n, quando n → ∞.

Observação: Esta aproximação será tanto melhor quanto maior for o número derepetições do experimento.

Exemplos:

1 - Ao lançar uma moeda honesta 5 vezes, ocorreram 4 caras. Baseado neste resultado,qual a probabilidade (aproximada) do evento A : ocorrer cara?

2 - Considere as seguintes situações:

(i) Numa pesquisa de mercado, 5 pessoas foram entrevistadas das quais 4 disseramque comprariam um novo produto a ser lançado.

(ii) Numa outra pesquisa de mercado, 300 pessoas foram entrevistadas das quais140 disseram que comprariam um novo produto a ser lançado.

a) Para cada pesquisa, determine a probabilidade de que uma pessoa qualquercompre o novo produto.

b) Em qual das duas probabilidades estimadas você confia mais?

38

Page 39: Probab Il i Dade

4.3.2 Definição Clássica de Probabilidade

4.3.2.1 Introdução e definição

Definição 4.6 (Evento Simples e Evento Composto). Cada um dos possíveis

resultados que compõe o espaço amostral e1, e2, e3, . . . é um evento simples, enquantoum evento composto, A, é uma coleção de eventos simples.

Exemplo: Ao lançar um dado, os eventos simples serão: 1, 2, 3, 4, 5 e 6e um evento composto seria A : número par = 2, 4, 6.

Definição 4.7 (Definição Clássica de Probabilidade). Suponha que um expe-

rimento tenha n eventos simples diferentes, cada um dos quais pode ocorrer com amesma chance. Se r eventos simples são favoráveis à ocorrência do evento A, então

P (A) =Número de eventos simples favoráveis à ocorrência do evento A

Número total de resultados possíveis=

#A

#S=

r

n.

Observações:

(1) Nesta definição é fundamental que os eventos simples sejam igualmente prováveis,e, neste caso, é evidente que:

(i) P (e1) = P (e2) = ... = P (en) = 1n, e

(ii) P (e1) + P (e2) + ... + P (en) = 1n

+ 1n

+ ... + 1n

= n. 1n

= 1.

(2) Espaços amostrais com as características acima descritas são conhecidos comoEspaços Amostrais Finitos e Equiprováveis.

Exemplos:

1 - Considere o experimento E: lançar um dado equilibrado e observar o número da facesuperior. Considere também, os seguintes eventos:

. A: Ocorre face par =

. B: Ocorre um número menor que 4 =

. C: ocorre face menor que 7 =

. D: ocorre face cujo valor é maior que 6 =

. A ∩ B =

. A ∪ B =

. B =

Determine a probabilidade de ocorrência de cada um dos eventos acima definidos.

39

Page 40: Probab Il i Dade

4.3.2.2 Noções Básicas de Técnicas de Contagem

Nem sempre a tarefa de calcular a probabilidade de um evento aleatório, da formaP (A) = r/n, é simples. Em algumas situações é necessário alguns procedimentos sistemá-ticos de contagem ou enumeração para se obter o número de maneiras, r, pelas quais Apode ocorrer, bem como o número total de maneiras, n, pelas quais o espaço amostral Spode ocorrer.

É no contexto descrito acima, que as técnicas de contagem são de fundamental im-portância. Neste curso, veremos apenas alguns dos principais procedimentos de contagem.

4.3.2.2.1 Princípio Fundamental da Contagem - Regra da Multiplicação

Suponha que um experimento possa ser realizado em k etapas, de modo que, para aprimeira etapa existem n1 resultados possíveis, para a segunda etapa n2 resultados possíveis,e assim sucessivamente, até que para a k − ésima etapa existem nk resultados possíveis.Então, existe um total de

n1 × n2 × .... × nk

resultados possíveis para este experimento.

Exemplos:

1 - Ao lançar um dado e uma moeda, quantos resultados possíveis podem ser obtidos?Resp.: 12

2 - Uma companhia produz fechaduras que usam segredos numéricos para serem abertas.Se cada segredo consiste de três números distintos, escolhidos dentre os inteiros de0 a 9, quanto segredos diferentes poderão ser fabricados? Resp.: 720

3 - Quantos números naturais de 4 algarismos podem ser formados usando-se apenas osalgorismos 2, 3, 4 e 5, de forma que sejam menores do que 5000 e divisíveis por 5?Resp.: 48

4.3.2.2.2 Combinação

Quando uma amostra de k elementos for retirada (sem importar a ordem entre si) deum conjunto de n elementos. O número de diferentes amostras possíveis é denotado por(

nk

)

e é igual a:(

nk

)

=n!

k!(n − k)!

onde o símbolo ! significa que:

n! = n(n − 1)(n − 2)(n − 3) . . . (3)(2)(1)

Por exemplo, 5! = 5.4.3.2.1 [Nota: A quantidade 0! é definida como sendo igual a 1.]

40

Page 41: Probab Il i Dade

Exemplos:

1 - Qual é o número de possíveis empreendimentos quando desejamos selecionar doisdentre quatro? Resp: 6

2 - Suponha que num lote com 20 peças existem cinco defeituosas. Escolhemos 4 peçasdo lote ao acaso, ou seja, uma amostra de 4 elementos, de modo que a ordem doselementos seja irrelevante:

a) Quantas amostras possíveis existem? Resp: 4845

b) Dentre todos os possíveis resultados, quantos levam à escolha de duas peçasdefeituosas? Resp.: 1050

c) Qual é a probabilidade de sair duas peças defeituosas? Resp.: 0,217

41

Page 42: Probab Il i Dade

4.3.3 Definição Axiomática de Probabilidade

Definição 4.8 (Definição Axiomática de Probabilidade). Dado um espaço amos-

tral S, a probabilidade de um evento A ocorrer, representado por P (A) , é uma funçãodefinida em S, que associa a cada evento A um número real, satisfazendo os seguintesaxiomas:

(i) 0 ≤ P (A) ≤ 1;

(ii) P (S) = 1;

(iii) Se A e B forem mutuamente excludentes (A ∩ B = φ), então

P (A ∪ B) = P (A) + P (B) .

Observação: A probabilidade de um evento A, denotada por P (A) , indica a chancede ocorrência do evento A. Quanto mais próxima de 1 é P (A), maior é a chance deocorrência do evento A, e quanto mais próxima de zero, menor é a chance de ocorrênciado evento A.

Principais Teoremas:

T1. Se φ denota o conjunto vazio (Evento Impossível), então

P (φ) = 0.

T2. Se A é o evento complementar de A, então

P (A) = 1 − P (A) .

T3. Se A e B são dois eventos quaisquer, então

P (A ∪ B) = P (A) + P (B) − P (A ∩ B) .

Exemplo: Considere um experimento aleatório com espaço amostral S e os eventosA e B associados tais que: P (A) = 1/2, P (B) = 1/3 e P (A ∩ B) = 1/4. Determine:

a) P (A)

b) P (B)

c) P (A ∪ B)

d) P (A ∩ B)

e) P (A ∪ B)

42

Page 43: Probab Il i Dade

4.4 Eventos Independentes

A probabilidade da ocorrência de dois eventos simultaneamente, P (A ∩ B), dependeda natureza dos eventos, ou seja, se eles são independentes ou não.

Dois ou mais eventos são independentes quando a ocorrência ou não-ocorrência de umnão influencia a ocorrência do(s) outro(s).

Definição 4.9 (Eventos Independentes). Dois eventos A e B são independentes

se, e somente seP (A ∩ B) = P (A)P (B).

Exemplo 1: Se duas moedas equilibradas (sem vício) são lançadas, determine qual aprobabilidade de ambas darem cara? E se três moedas fossem lançadas, qual a probabilidadede ocorrer três caras?

Exemplo 2: Uma urna contém duas bolas brancas e cinco pretas. Qual a probabilidadede sair duas bolas pretas se os sorteios são feitos com reposição?

Exemplo 3: A probabilidade de que A resolva um problema é de 2/3, e a probabiliddaede que B o resolva é de 3/4. Se ambos tentarem independentemente, qual a probabilidadede:

a) Ambos resolverem o problema?

b) O problema ser resolvido?

Observação: Dizemos que três eventos são mutuamente independentes se

P (A ∩ B) = P (A)P (B)

P (A ∩ C) = P (A)P (C)

P (B ∩ C) = P (B)P (C)

P (A ∩ B ∩ C) = P (A)P (B)P (C)

Exemplo:

1 - Sendo S = 1, 2, 3, 4 um espaço equiprovável e A = 1, 2; B = 1, 3; C = 1, 4três eventos de S; verifique se os eventos A, B e C são mutuamente independentes.

43

Page 44: Probab Il i Dade

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus IUNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICADisciplina: Probabilidade e Estatística (6 créditos) Período 2009.2Prof. Gilberto Matos e Areli MesquitaAluno(a): .

3a LISTA DE EXERCÍCIOSIntrodução à Probabilidade

1 - De uma linha de produção são retirados três (3) artigos e cada um é classificadocomo bom (B) ou defeituoso (D). Determine o espaço amostral deste experimentoaleatório e expresse também o evento A: obter dois artigos defeituosos.

2 - Pedro tem dois automóveis velhos. Se nas manhãs frias, há 20% de probabilidade deum deles não funcionar e 30% de outro não funcionar,

a) qual a probabilidade de nenhum funcionar?

b) qual a probabilidade dos dois funcionarem?

c) qual a probabilidade de pelo menos um funcionar?

d) qual a probabilidade de exatamente um funcionar?

3 - Considere o lançamento de dois dados equilibrados com o interesse de observar onúmero das faces superiores.

a) Calcule a probabilidade dos eventos:

i) A: sair face par nos dois dadosii) B: sair face par no primeiro dadoiii) C: sair face par no segundo dado

d) Os eventos B e C são independentes?

4 - De 120 estudantes, 60 estudam Francês, 50 Espanhol e 20 estudam Francês e Es-panhol. Se um estudante é escolhido ao acaso, encontre a probabilidade de queele:

a) estude Francês e Espanhol?

b) estude pelo menos uma das línguas?

c) não estude nem Francês nem Espanhol?

5 - Ao escolher entre diversos fornecedores de computadores, um comprador deseja sabera probabilidade de um computador falhar durantes os dois primeiros anos. Sabendo-seque só existem duas possibilidades; ou o computador falha durante os dois primeirosanos ou não falha, qual é essa probabilidade? Agora se você conhecesse o resultadode uma pesquisa do PC World feita com 4000 usuários de computadores, na qualrevela que 992 computadores falham durantes os dois primeiros anos, qual será aprobabilidade estimada? Resp.: 0,5 e 0,248.

44

Page 45: Probab Il i Dade

6 - Um terço dos eleitores de certa comunidade é constituido de mulheres, e 40% doseleitores votaram na última eleição presidencial. Supondo que esses dois eventossejam independentes, determine a probabilidade de escolher um eleitor da lista geral,que seja mulher e que tenha votado na última eleição presidencial.

7 - Uma urna contém duas bolas brancas e cinco pretas. Qual a probabilidade de sairduas bolas pretas supondo que os sorteios são feitos com reposição?

8 - Se cada carta de um baralho de 52 cartas tem a mesma chance de ser escolhida,então qual é a probabilidade de:

a) se extrair cada uma delas?

b) de se extrair uma dama?

9 - Qual a probabilidade de se obter três ou menos pontos no lançamento de um dado?

10 - Uma urna contém duas bolas brancas, três pretas e cinco azuis.

a) Qual a probabilidade de se extrair uma bola branca?

b) Qual a probabilidade de se extrair uma bola preta ou uma azul?

11 - No lançamento de dois dados qual a probabilidade de sair o par (5,2)?

45

Page 46: Probab Il i Dade

4.5 Probabilidade Condicional

Em algumas situações, a probabilidade de ocorrência de um certo evento pode serafetada se tivermos alguma informação sobre a ocorrência ou não de um outro evento.Considere, por exemplo, o seguinte experimento:

E : Lançar um dado.

Seja o evento A: sair o no 3 =

Então, P (A) =

Considere, agora, o seguinte evento:

B: sair um número ímpar =

Logo, P (B) =

Suponha, agora, que soubéssemos da ocorrência de B e que quiséssemos calcular aprobabilidade de A. Iremos denotar essa probabilidade como P (A | B). Assim,

P (A | B) =

Formalmente definimos probabilidade condicional da maneira a seguir.

Definição 4.10 (Probabilidade Condicional). Dados dois eventos, A e B, deno-

taremos P (A | B) a probabilidade condicionada do evento A, quando B tiver ocorrido,por:

P (A | B) =P (A ∩ B)

P (B)

com P (B) 6= 0.

Exemplo: Dois dados são lançados e os seguintes eventos são considerados:

A = (x1, x2); x1 + x2 = 10, e

B = (x1, x2); x1 > x2.Baseado nestas informações, obtenha as seguintes probabilidades:

a) P (A) c) P (A ∩ B) e) P (B | A)

b) P (B) d) P (A | B)

46

Page 47: Probab Il i Dade

4.5.1 Teorema do Produto

A partir da definição de probabilidade condicional, poderemos enunciar o teorema doproduto:

Teorema 1.2 (Teorema do Produto)

P (A | B) = P (A∩B)P (B)

⇒ P (A ∩ B) = P (B)P (A | B).

Analogamente,

P (B | A) = P (A∩B)P (A)

⇒ P (A ∩ B) = P (A)P (B | A).

Exemplos:

1 - Em um lote de 12 peças, 4 são defeituosas. Se duas peças são retiradas uma após aoutra sem reposição, qual a probabilidade de que:

a) ambas sejam boas?

b) ambas sejam defeituosas?

c) pelo menos uma seja defeituosa?

2 - Uma urna contém duas bolas brancas, três vermelhas e cinco azuis. Qual a pro-babilidade de se retirar sem reposição uma bola azul, uma branca e uma vermelhaexatamente nessa ordem?

4.6 Eventos Independentes

Um evento A é considerado independente de um outro evento B se a probabilidade condi-cional de A dado B é igual a probabilidade de A, isto é, se

P (A | B) = P (A).

É evidente que se A é independente de B, então B é independente de A. Assim,

P (B | A) = P (B).

Logo, considerando o Teorema do Produto, observamos que a probabilidade da ocor-rência de dois eventos simultaneamente, P (A ∩ B), depende da natureza dos eventos,ou seja, se eles são independentes ou não e no caso dos eventos serem independentes jásabemos que

P (A ∩ B) = P (A)P (B).

Observação: A recíproca é verdadeira, isto é, se P (A ∩ B) = P (A)P (B), então Ae B são eventos independentes.

47

Page 48: Probab Il i Dade

4.7 Teorema da Probabilidade Total

Definição 4.11 (Partição do Espaço Amostral). Dizemos que os eventos B1, B2, ..., Bk

representam uma partição do espaço amostral S, quando

a) Bi ∩ Bj = φ, para todo i 6= j,

b) ∪ki=1Bi = S,

c) P (Bi) > 0, para todo i.

Considere, agora, um evento A referente a S, e B1, B2, ..., Bk uma partição de S.Assim, podemos escrever

A = (A ∩ B1) ∪ (A ∩ B2) ∪ (A ∩ B3) ∪ ... ∪ (A ∩ Bk).

Logo,

P (A) = P (A ∩ B1) + P (A ∩ B2) + P (A ∩ B3) + ... + P (A ∩ Bk).

Então, como P (A∩Bj) = P (Bj)P (A | Bj), obteremos o que se denomina o Teoremada Probabilidade Total:

P (A) = P (B1)P (A | B1) + P (B2)P (A | B2) + ... + P (Bk)P (A | Bk).

4.8 Teorema de Bayes

Sob as mesmas hipóteses do teorema da probabilidade total, podemos calcular a pro-babilidade de Bi dada a ocorrência de A da seguinte forma

P (Bi | A) =P (Bi ∩ A)

P (A)=

P (Bi)P (A | Bi)∑

j P (Bj)P (A | Bj).

Este resultado é o que chamamos de Teorema de Bayes. Esse teorema é útilquando conhecemos as probabilidades dos B

is e a probabilidade condicional de A dado Bi,mas não conhecemos diretamente a probabilidade de A.

Exemplos:

1 - A proporção de peças produzidas pelas máquinas I, II e III é 30%, 30% e 40%, res-pectivamente. Dentre estas peças, 4%, 3% e 2%, respectivamente, são defeituosas.Uma peça escolhida aleatoriamente, foi testada e verificou-se ser defeituosa. Qual éaprobabilidade de que a peça tenha sido produzida pela máquina I? E pela máquinaII? E pela III?

48

Page 49: Probab Il i Dade

2 - Suponha três urnas com as seguintes configurações: a urna 1 contém 3 bolas pretas,1 branca e 5 vermelhas; a urna 2 contém 4 bolas pretas, 3 brancas e 2 vermelhas; aurna 3 contém 2 bolas pretas, três brancas e 3 vermelhas. Escolheu-se uma urna aoacaso e dela extraiu-se uma bola ao acaso, verificou-se que a bola é branca. Qual aprobabilidade da bola ter vindo da urna 1, 2? E da 3?

49

Page 50: Probab Il i Dade

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus IUNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICADisciplina: Probabilidade e Estatística (6 créditos) Período 2009.2Prof. Gilberto Matos e Areli MesquitaAluno(a): .

4a LISTA DE EXERCÍCIOS

Independência Estatística, Probabilidade Condicional, Teorema daProbabilidade Total e de Bayes

1 - Suponha que a probabilidade de que ambas crianças gêmeas sejam meninos é 0,30 eque a probabilidade de que sejam meninas é 0,26. Dado que a probabilidade de umacriança seja menino é 0.52, qual é a probabilidade de que:

a) A segunda criança seja um menino, sabendo-se que o primeiro é um menino?Resp.: 0,577.

b) A segunda criança seja uma menina, sabendo-se que a primeira é uma menina?Resp.: 0,542.

2 - Uma urna contém duas bolas brancas, três verdes e cinco azuis. Se três bolas sãoretiradas ao acaso, sem reposição, determine a probabilidade de:

a) três bolas verdes ocorrerem. Resp.: 0,0083.

b) exatamente uma bola verde ocorrer.Resp.: 0,175.

3 - A probabilidade de que um time de futebol vença seu próximo oponente é estimadaem 0,7 se não chover, mas só em 0,5 se chover. Se os registros meteorológicosmostrarem que choveu 40 por cento das vezes, na data do jogo, nos anos passados,qual a probabilidade de que o time vença seu próximo oponente? Resp.: 0,62.

4 - Suponhamos que seja de 0,005 a probabilidade de que o motor de um monomotor decombate falhe na decolagem e que a taxa de falha técnica do motor de um bimotorde combate seja de 0,003. Se o bimotor não puder decolar a não ser que ambos osmotores estejam operando adequadamente, que avião é mais seguro na decolagem?Resp.: P (bimotor falhar na decolagem) = 0, 006.

5 - Empregados de certa firma são submetidos a um teste de aptidão quando empregadospela primeira vez. A experiência mostrou que dos 60 por cento que passaram no teste,80 por cento deles eram bons trabalhadores, enquanto dos 40 por cento dos que nãoconseguiram passar só 30 por cento foram avaliados como bons trabalhadores. Quala probabilidade de que um empregado escolhido ao acaso seja um bom trabalhador?Use aqui a técnica da árvore. Resp.: 0,60.

6 - Suponhamos que seja p a probabilidade de que o tempo (com sol ou nublado) seja omesmo do dia anterior. Se hoje for dia de sol, qual a probabilidade de que depois deamanhã tenhamos também um dia de sol? Resp.: 2p2 − 2p + 1

50

Page 51: Probab Il i Dade

Teorema de Bayes

7 - Um saco contém três moedas, uma das quais foi cunhada com duas caras, enquantoas outras duas são normais e não viciadas. Uma moeda é retirada ao acaso e jogada.Dado que o resultado foi cara, qual a probabilidade de que essa seja a moeda de duascaras? Resp.: 0,5.

8 - As probabilidades de que três homens atinjam um alvo são, respectivamente, 16, 1

4e 1

3.

Cada um atira uma vez em direção ao alvo.

a) Determine a probabilidade p de que exatamente um deles atinja o alvo. Resp.:0,431.

b) Se apenas um atinge o alvo, qual a probabilidade de ele ser o primeiro homem?Resp.: 0,194.

51

Page 52: Probab Il i Dade

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus IUNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICADisciplina: Probabilidade e Estatística (6 créditos) Período 2009.2Prof. Gilberto Matos e Areli MesquitaAluno(a): .

6a NOTA DE AULA

5 Variáveis Aleatórias: Discretas e Contínuas

5.1 Introdução

Ao descrever um espaço amostral S associado a um experimento E, podemos obser-var que os resultados possíveis não são, necessariamente, núméricos. Consideremos, porexemplo, o seguinte experimento:

E1: Lançar duas moedas e observar a face superior de cada uma.

Neste experimento, temos S = CC, CK, KC, KK e, na prática, o que realmentepodemos estar interessados em observar é, por exemplo, o número de vezes que ocorrecara (K), ou seja, temos interesse num número real que está associado a cada resultado doespaço amostral S.

Definição 5.1 (Variável Aleatória). Seja E um experimento aleatório e S um

espaço amostral associado ao experimento. Dizemos que a função X é uma variávelaleatória quando associa a cada elemento do espaço amostral, s ∈ S, um número real,x = X(s).

Notação: X, Y , Z, etc.

Esquematicamente, temos:

(Esboçar a função (ou variável aleatória) que associa a cada elemento

do espaço amostral, s ∈ S, um número real, x = X(s) )

52

Page 53: Probab Il i Dade

Exemplo 1: Considere o experimento

E1: Lançar duas moedas e observar a seqüência de caras (K) e coroas (C).

Se X é a variável aleatória que representa o número de vezes que ocorre cara (K):

a) Descreva o espaço amostral, S, e obtenha os possíveis valores que a variável aleatóriaX pode assumir.

b) Represente através de um gráfico o espaço amostral e a função X = X(s), isto é, avariável aleatória X.

Solução:

Através do Exemplo 1, podemos notar que, ao descrever um espaço amostral S asso-ciado a um experimento E, não necessariamente, um resultado individual é um número.Neste exemplo, vimos que S = KK, CK, KC, CC e, na prática, o que realmente po-demos estar interessados em observar é o número de vezes que ocorre cara (K), ou seja,temos interesse num número real que está associado a cada resultado do espaço amostralS.

Definição 5.2 (Eventos Equivalentes). Sejam um experimento E e seu espaço

amostral S. Seja X uma variável aleatória definida em S e seja RX seu contradomínio.Seja B um evento definido em relação a RX, isto é, B ⊂ RX. Defina o evento A como

A = s ∈ S; X(s) ∈ B.

Neste caso dizemos que A e B são eventos equivalentes.

Definição 5.3 (Probabilidade de Eventos Equivalentes). Seja B um evento no

contradomínio RX . Nesse caso, definimos P (B) da seguinte maneira:

P (B) = P (A), onde A = s ∈ S; X(s) ∈ B.

53

Page 54: Probab Il i Dade

Exemplo: A partir do exemplo anterior, temos RX = 0, 1, 2, onde cada um dessesvalores ocorre com as seguintes probabilidades:

5.2 Variáveis Aleatórias Discretas

Definição 5.4 (Variável Aleatória Discreta). Dizemos que uma variável aleatória

é discreta se o número de valores possíveis é finito ou infinito enumerável (contável),de maneira que podemos listar todos os resultados como x1, x2, x3, ....

Definição 5.5 (Função de Probabilidade). É a função p = p(xi) que associa uma

probabilidade a cada valor xi da variável aleatória X.

Notação:

X x1 x2 x3 . . .P (X = xi) = p(xi) p(x1) p(x2) p(x3) . . .

Definição 5.6 (Distribuição de Probabilidades). Ao conjunto de todos os pares

[xi, p(xi)], i = 1, 2, ..., n, ... damos o nome de Distribuição de Probabilidades davariável aleatória X, desde que:

1. p(xi) ≥ 0, ∀i;

2. Σ∞i=1p(xi) = 1.

Exemplo 2: A partir do Exemplo 1, obtenha a distribuição de probabilidades davariável aleatória X e represente-a através de um gráfico.

Exemplo 3: Considerando a variável aleatória (v.a.) X cuja função de probabilidadeé dada por:

P (X = x) =1

2x, x = 1, 2, 3, ...

54

Page 55: Probab Il i Dade

a ) Mostre que X tem realmente uma distribuição de probabilidades.

b ) Faça um gráfico representando o comportamento desta distribuição.

c ) Obtenha:

i . P (X ser par)

ii . P (X ≥ 3)

iii . P (X ser múltiplo de 3)

5.3 Variáveis Aleatórias Contínuas

Definição 5.7 (Variável Aleatória Contínua). A variável aleatória X é contínua

se existir uma função f , denominada função densidade de probabilidade (f.d.p.) de Xque satisfaça às seguintes condições:

a) f(x) ≥ 0 para todo x;

b)∫ +∞

−∞f(x)dx = 1.

Observações: Se X é uma variável aleatória contínua, então:

(i) P (X = k) = 0, onde k é qualquer valor real.

(ii) Para quaisquer a, b, com −∞ < a < b < +∞, teremos

P (a ≤ X ≤ b) = P (a < X ≤ b)

= P (a ≤ X < b)

= P (a < X < b)

=

∫ b

a

f(x)dx.

Probabilidade essa, que pode ser representada pela área sob o gráfico da função f nointervalo [a, b], tal como ilustrado abaixo:

55

Page 56: Probab Il i Dade

(Esboçar o gráfico representando a área definida por P (a < X < b) =∫ b

af(x)dx)

Exemplos:

1 - Suponha que estamos atirando dardos em um alvo circular de raio de 10 cm, e sejaX a distância do ponto atingido pelo dardo ao centro do alvo. A f.d.p. de X é

f(x) =

kx, 0 ≤ x ≤ 100, c.c

a) Qual a probabilidade de acertar a mosca, se ela é um círculo de raio 1 cm?

b) Mostre que a probabilidade de acertar qualquer círculo concêntrico é proporci-onal a sua área.

2 - Uma variável aleatória contínua X é dita ter distribuição uniforme se a sua f.d.p. éda forma

f(x) =

k, se a < x < b0, caso contrário

a) Encontre o valor de k para que a função f seja realmente uma f.d.p.

b) Esboce o gráfico da distribuição de X.

5.4 Função de Distribuição Acumulada

Definição 5.8 (Função de Distribuição Acumulada - f.d.a.). A função de distri-

buição acumulada F , ou simplesmente função de distribuição (f.d.) de uma variávelaleatória X qualquer é definida como

F (x) = P (X ≤ x), ∀ x ∈ ℜ.

Observação:

a) Se a variável aleatória X for discreta, então a função de distribuição será dada por

F (x) = P (X ≤ x) =∑

i ; xi≤x

p(xi),

b) Se a variável aleatória X for contínua, então a função de distribuição será dada por

F (x) = P (X ≤ x) =

∫ x

−∞

f(t)dt.

56

Page 57: Probab Il i Dade

Exemplos:

1 - Suponhamos que a variável aleatória X tome os três valores 0,1 e 2, com proba-bilidades 1/3, 1/6 e 1/2, respectivamente. Encontre a função de distribuição F erepresente-a graficamente.

2 - Encontre a função de distribuição de X cuja f.d.p. é dada por

f(x) =

2x, 0 < x < 1,0, c.c.

Esboçe os gráficos da f.d.p., f(x), e da função de distribuição F .

3 - Se a variável aleatória X tem distribuição uniforme obtenha a função de distribuiçãode X e represente-a graficamente.

57

Page 58: Probab Il i Dade

5.4.1 Propriedades da Função de Distribuição

A seguir veremos algumas propriedades importantes da função de distribuição acumu-lada F de uma variável aleatória X qualquer:

(i) A função F é não decrescente.

(ii) F é contínua à direita.

(iii)F (−∞) ≡ lim

x→−∞F (x) = 0

e

F (+∞) ≡ limx→+∞

F (x) = 1.

Alguns Teoremas importantes relacionados à função de distribuição acumulada, tam-bém são apresentados a seguir:

Teorema 5.1. Seja X uma variável aleatória discreta, com valores possíveis x1, x2, ...,e suponha-se que esses valores tenham sido indexados de modo que x1 < x2 < .... SejaF a função de distribuição de X. Então,

p(xi) = P (X = xi) = F (xi) − F (x−i ),

onde F (x−i ) ≡ limh→0− F (xi + h).

Teorema 5.2. Seja F a função de distribuição de uma variável aleatória contínua,com f.d.p. f . Então,

f(x) =dF (x)

dx,

para todo x no qual F seja derivável.

Observações:

1) Se X for uma variável aleatória discreta, o gráfico da função de distribuição seráconstituído por segmentos de reta horizontais. Além disso, a função F é contínua, excetonos valores possíveis de X: x1, ..., xn, ...; pois, para cada valor xi o gráfico apresenta umsalto de magnitude p(xi) = P (X = xi).

2) Se X for uma variável aleatória contínua, então

(i) P (a < X < b) = F (b) − F (a).

(ii) P (X > a) = 1 − F (a).

58

Page 59: Probab Il i Dade

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus IUNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICADisciplina: Probabilidade e Estatística (6 créditos) Período 2009.2Prof. Gilberto Matos e Areli MesquitaAluno(a): .

5a LISTA DE EXERCÍCIOS

Variáveis Aleatórias: Discretas e Contínuas

1 - Sabendo-se que a v.a. X assume os valores 1,2 e 3 e que sua função de distribuiçãoF (x) é tal que

F (1) − F (1−) = 1/4,

F (2) − F (2−) = 1/2,

F (3) − F (3−) = 1/4.

Obter a distribuição de X, a função de distribuição acumulada e seu respectivográfico.

2 - Dada a seguinte função de distribuição

F (x) =

0, x < 0,1 − e−x, x > 0.

a ) Encontre a probabilidade da variável X assumir os seguintes valores:

i . P (X = 1);ii . P (0.5 < X < 1);iii . P (X > 1);

d ) Esboçe um gráfico ilustrando cada uma das situações descritas acima.

e ) Determine o valor de α tal que F (α) = 1/4.

f ) Encontre a f.d.p. da variável X.

7 - Suponhamos que uma válvula eletrônica seja posta em um soquete e ensaiada. Ad-mitamos que a probabilidade de que o teste seja positivo seja 3

4; daí, a probabilidade

de que seja negativo é igual a 14. Adimitamos também que estejamos ensaiando uma

partida grande dessas válvulas. Os ensaios continuam até que a primeira válvulapositiva apareça. Considere a variável aleatória X: no de testes necessários paraconcluir o experimento. Assim

S =

P (X = n) =

8 - Seja X o tempo até a desintegração de alguma partícula radioativa e suponha que afunção de distribuição de X seja dada por

F (x) =

0, x < 0,1 − e−λx, x > 0.

Suponha que λ seja tal que P (X ≥ 0, 01) = 1/2. Obtenha um número t tal queP (X ≥ t) = 0, 9.

59

Page 60: Probab Il i Dade

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus IUNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICADisciplina: Probabilidade e Estatística (6 créditos) Período 2009.2Prof. Gilberto Matos e Areli MesquitaAluno(a): .

7a NOTA DE AULA

6 Caracterização Adicional das Variáveis Aleatórias

6.1 Introdução

De maneira análoga ao que acontece na estatística descritiva (resumo de dados),no estudo de variáveis aleatórias precisamos de algumas características numéricas quepossam nos fornecer uma idéia sobre o comportamento da distribuição de probabilidade.A estas características denominamos de parâmetros da distribuição.

Dois dos principais parâmetros são: o valor esperado e a variância. O valor esperadode uma distribuição de probabilidades nos dá uma idéia de um valor médio ou central dadistribuição. Por outro lado, a medida que nos dá o grau de dispersão (ou de concentração)dos valores assumidos pela variável em torno da média é a variância.

6.2 O Valor Esperado ou Esperança de Uma Variável Aleatória

Definição 6.1 (Valor Esperado de uma Variável Aleatória).

Caso 1: Variável Aleatória Discreta

Seja X uma variável aleatória discreta, com valores possíveis x1, x2, ..., xn, ... Sejap(xi) = P (X = xi), i = 1, 2, ..., n, ... Então, o valor esperado de X (ou esperançamatemática de X), denotado por E(X) é definido como

E(X) = Σ∞i=1xip(xi),

se a série definida acima convergir absolutamente, isto é, se

Σ∞i=1 |xi| p(xi) < ∞.

Este número é também denominado o valor médio de X, ou expectância de X.

60

Page 61: Probab Il i Dade

Caso 2: Variável Aleatória Contínua

Seja X uma variável aleatória contínua com f.d.p. f . Então, o valor médio de X ouo valor esperado de X é definido como

E(X) =

∫ +∞

−∞

xf(x)dx.

Pode acontecer que esta integral (imprópria) não convirja. Conseqüentemente, diremosque E(X) existirá se, e somente se,

∫ +∞

−∞

|x| f(x)dx

for finita.

Exemplos:

1 - Um fabricante produz peças tais que 10% delas são defeituosas e 90% delas sãonão-defeituosas. Se uma peça defeituosa for produzida, o fabricante perde R$ 1,enquanto uma peça não-defeituosa lhe dá um lucro de R$ 5. Se X for o lucro líquidopor peça, qual o valor esperado de X?

2 - Uma variável aleatória contínua X definida num intervalo [a, b] é dita ter distribuiçãouniforme se possui a seguinte f.d.p.

f(x) =

1

b−a, a ≤ x ≤ b,

0, c.c.

Encontre a esperança dessa variável aleatória.

3 - Seja a variável aleatória X definida como segue. Suponha que X seja o tempo (emminutos) durante o qual um equipamento elétrico seja utilizado em carga máxima,em um certo período de tempo especificado. Suponha ainda, que X seja uma variávelaleatória contínua com a seguinte f.d.p.:

f(x) =

x15002 , 0 ≤ x ≤ 1500,−(x−3000)

15002 , 1500 < x ≤ 3000,0, c.c.

Encontre o tempo médio (em minutos) que o equipamento elétrico é utilizado emcarga máxima.

61

Page 62: Probab Il i Dade

6.3 Esperança de uma Função de uma Variável Aleatória

É intuitivamente evidente a idéia de que qualquer função de uma variável aleatória X,Y = H(X), também é uma variável aleatória, pois qualquer resultado aleatório, X = x,resultará num resultado também aleatório Y = h(x) = y. Desta forma, terá sentidocalcular E(Y ).

Para se obter o valor esperado de Y = H(X) existem duas maneiras que se mostramequivalentes. A primeira requer que se obtenha primeiramente a distribuição de Y ; problemaeste que será abordado posteriormente. Uma segunda maneira requer, simplesmente, oconhecimento da distribuição de probabilidade de X.

Definição 6.2 (Esperança de uma Função de uma de uma Variável Aleatória). Seja

X uma variável aleatória e seja Y = H(X). Então,

(a) Se Y for uma variável aleatória discreta com valores possíveis y1, y2, ... e seq(yi) = P (Y = yi), o valor esperado de Y é definido por

E(Y ) = Σ∞i=1yiq(yi).

(b) Se Y for uma variável aleatória contínua com f.d.p. g, o valor esperado de Yé definido por

E(Y ) =

∫ +∞

−∞

yg(y)dy.

Teorema 6.1. Seja X uma variável aleatória e seja Y = H(X). Então,

(a) Se X for uma variável aleatória discreta e p(xi) = P (X = xi), tem-se que ovalor esperado de Y será dado por

E(Y ) = E[H(X)] = Σ∞j=1H(xj)p(xj).

(b) Se X for uma variável aleatória contínua com f.d.p. f , tem-se que o valoresperado de Y será dado por

E(Y ) = E[H(X)] =

∫ +∞

−∞

H(x)f(x)dx.

62

Page 63: Probab Il i Dade

6.4 Propriedades do valor esperado

Se X é uma v.a. e k é um valor qualquer, constante, então:

1. E[k] = k.

2. E[X + k] = E(X) + k.

3. E[kX] = kE(X).

4. E[X − µ] = 0, onde µ = E(X).

Demonstrações:

Exemplos:

1 - Um fabricante produz peças tais que 10% delas são defeituosas e 90% delas sãonão-defeituosas. Se uma peça defeituosa for produzida, o fabricante perde R$ 1,0,enquanto uma peça não-defeituosa lhe dá um lucro de R$ 5,0. Se X for o lucrolíquido por peça, determine:

a) O valor esperado de X.

b) Se houver um aumento de 10% nos valores de X, qual será o lucro líquidoesperado?

c) E Se houver um acréscimo de R$ 0,10 nos valores de X, em média, quanto seráo lucro líquido?

2 - Suponhamos que X seja uma variável aleatória com a seguinte f.d.p.

f(x) =

ex

2, se x ≤ 0,

e−x

2, se x > 0.

Se Y = |X|, qual será o valor de E(Y )?

63

Page 64: Probab Il i Dade

6.5 A Variância de uma Variável Aleatória

Definição 6.3 (Variância de uma Variável Aleatória).

Caso 1: Variável Aleatória Discreta

Dada a variável aleatória discreta X e a respectiva função de probabilidade p(x), avariância de X é dada por

V ar(X) = E[(X − µ)2] = Σ∞i=1(xi − µ)2p(xi),

onde µ = E(X).

Caso 2: Variável Aleatória Contínua

Seja X uma variável aleatória contínua com f.d.p. f . Então, a variância de X é dadapor

V ar(X) = E[(X − µ)2] =∫ +∞

−∞(x − µ)2f(x)dx

A raiz quadrada da Variância de X é denominada Desvio Padrão de X, ou seja,

DP (X) =√

V ar(X).

Exercício:

1 - Mostre queV ar(X) = E(X2) − E2(X),

onde E(X2) = Σ∞i=1x

2i p(xi).

Exemplos:

1 - Um fabricante produz peças tais que 10% delas são defeituosas e 90% delas sãonão-defeituosas. Se uma peça defeituosa for produzida, o fabricante perde R$ 1,0,enquanto uma peça não-defeituosa lhe dá um lucro de R$ 5,0. Se X for o lucrolíquido por peça, determine o desvio padrão da v.a. X.

2 - Se X é uma variável aleatória uniforme num intervalo [a, b], ou seja, X ∼ U(a, b),qual é o valor de V (X)?

3 - Seja V a velocidade do vento (em milhas por hora) e suponha-se que V seja unifor-memente distribuída sobre o intervalo [0, 10]. A pressão, digamos W (em libras/péquadrado), na superfície da asa de um avião é dada pela relação: W = 0, 003V 2.Encontre o valor esperado de W .

64

Page 65: Probab Il i Dade

4 - Se X é uma variável aleatória contínua com f.d.p.

f(x) =

1 + x, −1 ≤ x ≤ 0,1 − x. 0 ≤ x ≤ 1.

Obtenha a variância de X.

6.6 Propriedades da variância

Se X é uma v.a. e k é um valor qualquer, constante, então:

1. V ar(k) = 0.

2. V ar(X + k) = V ar(X).

3. V ar(kX) = k2V ar(X).

Demonstrações:

65

Page 66: Probab Il i Dade

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus IUNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICADisciplina: Probabilidade e Estatística (6 créditos) Período 2009.2Prof. Gilberto Matos e Areli MesquitaAluno(a): .

6a LISTA DE EXERCÍCIOS

Valor Esperado e Variância de Variáveis Aleatórias

1 - Uma urna contém 4 bolas brancas e 6 pretas. 3 bolas são retiradas com reposição.Seja X o número de bolas brancas. Calcular E(X) e D.P.(X). Resp.: E(X) = 1, 2.

2 - A função de probabilidade da variável aleatória X é: P (X = x) = 15, para X =

1, 2, 3, 4, 5. Calcular E(X) e E(X2), e usando esses resultados calcular:

a) E(X + 3)2;

b) V ar(3X − 2).

Resp.: E(X) = 3, V ar(X) = 2, a) 38 b) 18.

3 - Um investidor julga que tem 0, 40 de probabilidade de ganhar R$25.000,00 e 0, 60 deprobabilidade de perder R$15.000,00 num investimento.

a) Qual é o ganho esperado deste investidor?

b) Se G é o ganho líquido do investidor, qual será o ganho esperado de Y =10G − 1000?

4 - Uma seguradora paga R$30.000,00 em caso de acidente de carro e cobra uma taxade R$1.000,00. Sabe-se que a probabilidade de que um carro sofra acidente é de 3%.Quanto espera a seguradora ganhar por carro segurado? Resp.: E(L) = 100, 00

5 - Num jogo de dados, o jogador J1 paga R$ 20,00 ao jogador J2 e lança 3 dados. E aseguinte regra é adotada:

(A) Se sair face 1 em um dos dados apenas, J1 ganha R$ 20,00

(B) Se sair face 1 em dois dados apenas, J1 ganha R$ 50,00

(C) Se sair 1 nos três dados, J1 ganha R$ 80,00

(A) Se nenhuma face 1 sair, J1 não recebe valor algum.

Nestas condições, qual o lucro líquido esperado pelo jogador J1 em uma jogada?Você considera este jogo honesto? Por que? Resp.: R$ − 9, 21

66

Page 67: Probab Il i Dade

6 - Um banco pretende aumentar a eficiência de seus caixas. Para isto, o banco estáoferecendo um prêmio de R$ 150,00 para cada cliente atendido, além de 42 clientespor dia. O banco tem um ganho operacional de R$ 100,00 para cada cliente atendidoalém de 41. As probabilidades de atendimento são:

node clientes Até 41 42 43 44 45 46Probabilidade 0,88 0,06 0,04 0,01 0,006 0,004

Qual o ganho esperado do banco, se este novo sistema for implantado? O sistema évantajoso para o banco? Resp.: E(X) = 7, 30.

7 - Suponhamos que dez cartas estejam numeradas de 1 até 10. Das dez cartas, retira-seuma de cada vez, ao acaso e sem reposição, até retirar-se o primeiro número par. SeX é uma variável aleatória que expressa o número de retiradas necessárias.

a) Qual é a função de probabilidade de X?

b) Em quantas retiradas espera-se obter o primeiro número par?

8 - Um vendedor de equipamentos pesado pode visitar, num dia, um ou dois clientes,com probabilidade de 1/3 ou 2/3, respectivamente. De cada contato, pode resultara venda de um equipamento por R$ 50.000,00(com probalidade 1/10) ou nenhumavenda (com probabilidade 9/10). Indicando por Y o valor total de vendas diáriasdesse vendedor:

a) Escreva a função de probabilidade de Y ;

b) Qual é o valor total esperado de vendas diárias?

Resp.: a) Y = 0, 50.000, 100.000 com probabilidades 126/150, 23/150, 1/150. b)E(Y ) = 8.333, 33

9 - Calcule a variância do problema anterior.

10 - O tempo T , em minutos, necessário para um operário processar certa peça é umav.a. com a seguinte distribuição de probabilidade.

T = t 2 3 4 5 6 7P (T = t) 0,1 0,1 0,3 0,2 0,2 0,1

a) Calcule o tempo médio de processamento.Para cada peça processada, o operário ganha um fixo de R$ 2,00, mas, se eleprocessa a peça em menos de seis minutos, ganha R$ 0,50 em cada minutopoupado. Por exemplo, se ele processa a peça em quatro minutos, recebe aquantia adicional de R$ 1,00.

b) Encontre a distribuição, a média e a variância da v.a. G: quantia ganha porpeça.

67

Page 68: Probab Il i Dade

Resp.: a) E(T ) = 4, 6 b) E(G) = 2, 75 e V ar(G) = 0, 4125

11 - O serviço de meteorologia classifica o tipo de céu que é visível, em termos de “grausde nebulosidade”. Uma escala de 11 categorias é empregada: 0,1,2,...,10, onde 0representa um céu perfeitamente claro, 10 representa um céu completamente enco-berto, enquanto os outros valores representam as diferentes condições intermediárias.Suponha-se que tal classificação seja feita em uma determinada estação meteoroló-gica, em um determinado dia e hora. Seja X a variável aleatória que pode tomar umdos 11 valores acima. Admita que a distribuição de probabilidade de X seja

X = x 0 1 2 3 4 5 6 7 8 9 10P (X = x) 0,05 0,15 0,15 0,06 0,06 0,06 0,06 0,06 0,15 0,15 0,05

Encontre E(X), E(X2) e V ar(X).

12 - A percentagem de álcool (100X) em certo composto pode ser considerada uma va-riável aleatória, onde X, tem a seguinte função densidade:

f(x) = 2x3(1 − x), 0 < x < 1.

a) Obtenha a função de distribuição acumulada de X.

b) Calcule P (X ≤ 2/3)

c) Suponha que o preço de venda desse composto dependa do conteúdo de ál-cool. Especificadamente, se 1/3 < X < 2/3, o composto é vendido por C1

u.m/galão; caso contrário, é vendido por C2 u.m/galão, determine o lucro lí-quido médio por galão.

68

Page 69: Probab Il i Dade

Respostas

1 )

2 ) E(X) = 1, 2 e V ar(X) =

3 ) a) 38 ou 36?

b) 18.

4 ) E(X) = 7, 30

5 )

6 ) a) Y = 0, 50.000, 100.000 com probabilidades 126/150, 23/150, 1/150.

b) E(Y ) = 8.333.33

7 )

8 ) a) E(T ) = 4, 6

b) E(G) = 2, 75 e V ar(G) = 0, 4125

9 )

69

Page 70: Probab Il i Dade

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus IUNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICADisciplina: Probabilidade e Estatística (6 créditos) Período 2009.2Prof. Gilberto Matos e Areli MesquitaAluno(a): .

Relação de Exercícios para o 2 Estágio

Livro: "Estatística Básica". Wilton O. Bussab e Pedro A. Morettin. 5a. Edicão.

Capítulo 5 (Probabilidades):

Problema Página1 e 2 1055 e 6 106

8, 10 e 12 11015, 16, 18, 19 e 21 115

25 12126, 27, 28 e 30 122

34 e 36 12340 e 41 124

Capítulo 6 (Variáveis Aleatórias Discretas):

Problema Página1, 2 e 3 13513 e 14 139

19 14029 e 30 157

Capítulo 7 (Variáveis Aleatórias Contínuas):

Problema Página2 1665 17110 17228 194

70

Page 71: Probab Il i Dade

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus IUNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICADisciplina: Probabilidade e Estatística (6 créditos) Período 2009.2Prof. Gilberto Matos e Areli MesquitaAluno(a): .

8a NOTA DE AULA

7 Modelos Probabilísticos para Variáveis Aleatórias

Discretas

Introdução

Em muitas situações, alguns experimentos aleatórios apresentam características bas-tante peculiares. Este fato possibilita que, uma vez identificadas estas características, umparticular modelo probabilístico seja proposto para modelar o fenômeno em estudo.

É neste contexto, que passaremos ao estudo de alguns dos principais modelos proba-bilísticos.

7.1 Distribuição de Bernoulli

Em muitos experimentos os resultados são tais que ocorre ou não ocorre determinadacaracterística. Por exemplo:

1. Ao lançar uma moeda: o resultado ou é cara, ou não (ocorrendo, então, coroa);

2. Ao lançar um dado: ocorre número par ou não (ocorrendo número ímpar);

3. Uma pessoa é escolhida ao acaso dentre 1000: ou ela é do sexo masculino ou não (édo sexo feminino);

4. Uma pessoa é escolhida ao acaso dentre 1000: ou ela é favorável a um determinadoprojeto governamental ou não.

Em todas estes casos, estamos interessados na ocorrência (sucesso) ou não (fracasso)de determinada característica. Então, para cada experimento acima podemos definir umav.a. X, que assume valores: 1, se ocorrer sucesso, e 0, se ocorrer fracasso. E, indicaremospor p a probabilidade de sucesso, isto é, P (sucesso) = P (S) = p, 0 < p < 1.

71

Page 72: Probab Il i Dade

Definição 7.1 (Distribuição de Bernoulli). Uma variável aleatória X, que assume

apenas os valores 0 e 1; é dita ter distribuição de Bernoulli com parâmetro p, 0 < p < 1,se sua função de probabilidade é dada por

P (X = x) =

p, se x = 11 − p, se x = 0

Notação: X ∼ Ber(p).

Observação: Experimentos que resultam numa v.a. de Bernoulli são chamados en-saios de Bernoulli.

Propriedades:

E(X) = p

V ar(X) = p(1 − p)

Exemplo:

1 - Ao lançar um dado perfeito, considere a variável X: ocorre número menor que 3.Qual a distribuição de X. Obtenha os valores de E(X) e V ar(X).

7.2 Distribuição Binomial

Definição 7.2 (Experimento Binomial). Um experimento binomial consiste de n ten-

tativas independentes de um mesmo experimento aleatório, onde cada tentativa adimiteapenas dois resultados: sucesso com probabilidade p e fracasso com probabilidade 1−p.Pode-se dizer ainda, que um experimento binomial consiste de n ensaios independentesde Bernoulli, cuja probabilidade de sucesso em cada ensaio é constante e igual a p,0 < p < 1.

Definição 7.3 (Variável Aleatória Binomial). Uma variável aleatória definida como

X: número de sucessos num experimento binomial é dita ser uma Variável aleatóriaBinomial com parâmetros n e p.

Teorema 7.1. Se X é uma variável aleatória binomial com parâmetros n e p. Então

P (X = k) =

(nk

)

pk(1 − p)n−k, k = 0, 1, ..., n.

Notação: X ∼ B(n, p).

Propriedades:

E(X) = np

V ar(X) = np(1 − p)

72

Page 73: Probab Il i Dade

Exemplo:

1 - Dos estudantes de um certo colégio, 41% fumam cigarro. Numa pesquisa, pretende-se escolher seis estudantes ao acaso para darem sua opinião sobre o fumo. Nestapesquisa, qual é a probabilidade de

a) nenhum dos seis ser fumante?

b) todos serem fumantes?

c) pelo menos um fumar?

d) Quantos fumantes são esperados nesta pesquisa?

7.3 Distribuição Hipergeométrica

Considere uma população (conjunto) composta de N objetos, r dos quais têm umacerta característica A, logo, N − r não têm a característica A (A). Suponha que n dessesobjetos são escolhidos ao acaso sem reposição e que estamos interessados na variável

X : número de elementos que possuem a característica A dentre os n.

Então, a variável definida desta forma é dita ter distribuição hipergeométrica comparâmetros N , r e n e função de probabilidade dada por

P (X = x) =

(rx) (

N−r

n − x

)

(Nn) , x = 0, 1, 2, ..., min(r, n).

Notação: X ∼ hip(N, r, n).

Propriedades:

E(X) = np

V ar(X) = np(1 − p)N−nN−1

,

onde p = rN

é a probabilidade de se obter um objeto com a característica A numaúnica extração.

Observação: Quando a população é muito grande, ou seja, N → ∞, quandocomparado com n, a retirada ao acaso, com ou sem reposição, serão praticamente equi-valentes, de modo que a distribuição hipergeométrica se aproxima da distribuiçãobinomial.

73

Page 74: Probab Il i Dade

Exemplo:

1 - Em problemas de controle de qualidade, lotes com N itens são examinados. Onúmero de itens com defeito (atributo A), r, é desconhecido, mas, digamos que,por experiências passadas, você sabe que em lotes de N = 100 peças, 10% sãodefeituosas. Se num certo lote de 100 peças você escolhe ao acaso 5 itens, semreposição, qual é a probabilidade de:

a) nenhum item ser defeituoso?

b) não mais do que um item ser defeituoso?

c) Qual é o número esperado de itens defeituosos?

7.4 Distribuição de Poisson

Suponha, agora, que o interessse num certo experimento seja contar o número deocorrência de um certo evento, o qual pode ocorrer durante um intervalo de tempo, aolongo de uma superfície ou volume. Por exemplo:

1. Durante o intervalo de uma hora, observar o número de carros que passam numarodovia;

2. Ao inspecionar a pintura de um carro, deseja-se observar o número de falhas;

3. Ao realizar o controle de qualidade de um produto alimentício, deseja-se conhecer onúmero de bactérias.

Em todas estas condições poderemos trabalhar com a seguinte distribuição de proba-bilidade.

Definição 7.4 (Distribuição de Poisson). Dizemos que a variável aleatória X : nú-

mero de ocorrência de um certo evento num determinado intervalo de tempo, superfícieou volume, tem distribuição de Poisson com parâmetro λ (λ > 0) se sua função de pro-babilidade é dada por

P (X = x) =e−λλx

x!, x = 0, 1, 2, ...

Notação: X ∼ Poisson(λ).

Propriedades:

E(X) = λ

V ar(X) = λ

Observação: Se X tem distribuição Binomial, ou seja, X ∼ B(n, p), em que n ébastante grande com p pequeno, de sorte que np ≤ 7, então a distribuição de X seaproxima da distribuição de Poisson com parâmetro λ = np, isto é, X ∼ Poisson(np).

Exemplos:

74

Page 75: Probab Il i Dade

1 - Num livro de 800 páginas há 800 erros de impressão. Qual a probabilidade de queuma página contenha pelo menos 3 erros?

2 - Seja X ∼ B(200, 0, 01). Calcular P (X = 10) usando a distribuição binomial ecompare com o valor aproximado pela Poisson.

75

Page 76: Probab Il i Dade

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus IUNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICADisciplina: Probabilidade e Estatística (6 créditos) Período 2009.2Prof. Gilberto Matos e Areli MesquitaAluno(a): .

7a LISTA DE EXERCÍCIOS

Modelos Probabilísticos Discretos

1 - Se X tem distribuição binomial com parâmetros n e p, utilize o fato de X ser a somade n ensaios de Bernoulli para calcular a média e a variância de X.

2 - Sabendo-se que doze por cento dos que reservam lugar num vôo sistematicamentefaltam ao embarque e que o avião comporta 15 passageiros:

a) Determine a probabilidade de que todos os 15 que reservaram lugar compareçamao embarque.

b) Se houve 16 pedidos de reserva, determine a probabilidade:

i) de uma pessoa ficar de fora;ii) de nenhuma ficar de fora;iii) de mais de uma ficar de fora.

3 - Se 3% dos habitantes de uma grande cidade são empregados do Governo, determinea probabilidade de:

a) Nenhum ser empregado do Governo numa amostra aleatória de 50 habitantes?

b) Encontrar no máximo 3 empregados do governo na amostra do item anterior?

4 - Um fabricante de peças de automóvel garante que uma caixa de suas peças conterá,no máximo, duas defeituosas. Se a caixa contém 20 peças, e a experiência temdemonstrado que, em seu processo de fabricação, 6% das peças são defeituosas, qualé a probabilidade de que uma caixa satisfaça a garantia?

76

Page 77: Probab Il i Dade

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus IUNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICADisciplina: Probabilidade e Estatística (6 créditos) Período 2009.2Prof. Gilberto Matos e Areli MesquitaAluno(a): .

8a LISTA DE EXERCÍCIOS

Distribuição Binomial

1 - Para os exercícios (a) a (e) abaixo, considere o enunciado:

Das variáveis abaixo descritas, assinale quais são binomiais, e para essas dê os respec-tivos campos de definição e função de probabilidade. Quando julgar que a variávelnão é binomial, aponte as razões de sua conclusão.

a) De uma urna com dez bolas brancas e 20 pretas, vamos extrair, com reposição,cinco bolas. X é o número de bolas brancas nas cinco extrações.

b) Refaça o problema anterior, mas dessa vez as n extrações são sem reposição.

c) Temos cinco urnas com bolas pretas e brancas e vamos extrair uma bola decada urna. Suponha que X seja o número de bolas brancas obtidas no final.

d) Vamos realizar uma pesquisa em dez cidades brasileiras, escolhendo ao acasoum habitante de cada uma delas e classificando-o em pró ou contra um certoprojeto federal. Suponha que X seja o número de indivíduos contra o projetono final da pesquisa.

e) Em uma indústria existem 100 máquinas que fabricam determinada peça. Cadapeça é classificada como boa ou defeituosa. escolhemos ao acaso um instatntede tempo e verificamos uma peça de cada uma das máquinas. Suponha que Xseja o número de peças defeituosas.

2 - Numa certa cidade, nascem por ano 40% de crianças do sexo masculino. Nas famíliascom 4 crianças, qual a probabilidade de:

a) todas serem homens;

b) todas serem mulheres;

c) todas serem do mesmo sexo;

d) haver a mesma quantidade de homens e mulheres.

3 - De acordo com as estimativas de uma companhia de seguros, a probabilidade deincêndio numa casa é de 1% ao ano. A firma segura 400 casas.

a) Se muitos dos segurados vivem em casas adjacentes, por que tal circunstânciapode invalidar o uso da distribuição binomial?

b) Suponha que os segurados morem em casas distantes umas das outras. Qual aprobabilidade de:

77

Page 78: Probab Il i Dade

i) 0 incêndio?ii) 1 incêndio?

4 - A probabilidade de um atirador acertar o alvo é 1/3. Se ele atirar 6 vezes, qual aprobabilidade de:

a) acertar exatamente 2 tiros;

b) não acertar tiro algum.

Resp.: a) 80/243 b) 64/729.

5 - Em seis lançamentos de um dado equilibrado, qual a probabilidade de ocorrer:

a) nenhuma vez a face 6;

b) 6 vezes a face 2;

c) pelo menos uma vez a face 4.

Resp.: a) 33.49% b) 0.0021% c) 66.51%

6 - Em Campina Grande, nascem por ano 52% de crianças do sexo masculino. Nasfamílias com 4 crianças, qual a probabilidade de:

a) todas serem homens;

b) todas serem mulheres;

c) todas serem do mesmo sexo;

d) haver a mesma quantidade de homens e mulheres.

Resp.: a) 7.31% b) 5.31% c) 12.62% d) 37.38%

7 - Uma prova é composta de 10 questões objetivas, onde cada questão possui 5 alterna-tivas com apenas uma correta. Sabendo-se que um estudante não sabe respondê-lase irá apelar inteiramente pela sorte. Qual a probabilidadede que:

a) acerte 5 questões;

b) erre todas as questões;

c) acerte no mínimo 3 e, no máximo 5 questões;

d) qual o número esprerado de questões corretas?

Resp.: a) 2.64% b) 10.74% c) 31.58% d) 2

8 - Suponha que, em um determinado vôo, motores de avião falhem comprobabilidadeigual a 0.4, e independente. Suponha ainda que um avião voa com segurança se, pelomenos, metade dos seus motores não falha. Nestas condições, um avião quadrimotordeverá ser preferido a um bimotor? Justifique sua resposta!

Resp.: Não! O vôo com segurança do bimotor é de 84%, contra 82.02% do quadri-motor.

78

Page 79: Probab Il i Dade

9 - Num determinado processo de fabricação 10% das peças são consideradas defeituosas.As peças são armazenadas em caixas com 5 unidades cada uma.

a) qual a probabilidade de haver, pelo menos 1, defeituosa numa caixa?

b) Se a empresa paga uma multa de R$ 10,00 por cada caixa em que houver, pelomenos, uma peça defeituosa, qual o valor esperado da multa num total de 1000caixas?

Resp.: a) 40.95% b) R$4.095, 10

10 - Um produtor de sementes vende pacotes com 10 sementes cada. Os pacotes queapresentarem mais de uma semente sem germinar serão indenizados. A probabilidadede uma semente germinar é de 0.8.

a) Qual a probabilidade de um pacote ser indenizado?

b) Se o produtor vender 1000 pacotes, qual o número esperado de pacotes in-denizados?

c) Quando um pacote é indenizado, o produtor tem um prejuízo de R$ 1,20, e seo pacote não for indenizado, tem um lucro de R$ de 2,50. Qual o lucro líquidoesperado por pacote?

Resp.: a) 62.42% b) 624 c) R$0, 19

79

Page 80: Probab Il i Dade

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus IUNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICADisciplina: Probabilidade e Estatística (6 créditos) Período 2009.2Prof. Gilberto Matos e Areli MesquitaAluno(a): .

9a NOTA DE AULA

8 Modelos Probabilísticos para Variáveis Aleatórias

Contínuas

8.1 Distribuição Uniforme

Definição 8.1 (Distribuição Uniforme). Uma variável aleatória contínua X é dita ter

distribuição uniforme se a sua f.d.p. é da forma

f(x) =

1

b−a, se a < x < b

0, caso contrário

Notação: X ∼ U(a, b).

Propriedades:

E(X) = a+b2

e V ar(X) = (b−a)2

12

(Construa um gráfico que ilustre a forma da f.d.p. de uma uniforme qualquer)

Exemplo: Suponha que uma pane pode ocorrer em qualquer ponto de uma redeelétrica de 10 Km. Obtenha a probabilidade de que uma pane ocorra em um ponto cujadistância seja no máximo 1 Km das extremidades.

80

Page 81: Probab Il i Dade

8.2 Distribuição Exponencial

Definição 8.2 (Distribuição Exponencial). Uma variável aleatória contínua X, as-

sumindo todos os valores não negativos, terá distribuição exponencial com parâmetroα > 0, se sua f.d.p. é dada por

f (x) =

αe−αx, x > 0

0, c.c.

Notação: X ∼ Exp(α).

Propriedades:

(i) E(X) = 1α

e V ar(X) = 1α2

(ii) A função de distribuição acumulada F de uma exponencial com parâmetro α é dadapor

F (x) = 1 − e−αx, x > 0.

(iii) (Falta de memória) Para todo s, t > 0, teremos

P (X > s + t | X > s) = P (X > t) .

(Construa um gráfico que ilustre a forma da f.d.p. de uma exponencial

qualquer)

Exemplo: O tempo de vida (em horas) de um transistor pode ser considerado umavariável aleatória com distribuição exponencial cuja média é igual a 500 horas. De acordocom essas características, qual é a probabilidade de que um determinado transistor duremais do que a média?

81

Page 82: Probab Il i Dade

8.3 Distribuição Normal (Gaussiana)

A distribuição Normal é talvez a mais importante das distribuições de probabilidade,por razões que possivelmente ficarão claras ao longo deste curso. Erros de mensuração defenômenos físicos ou econômicos são freqüentemente modelados pela distribuição Normal,mas esta não é a única aplicação desta densidade. Por exemplo, a distribuição dos pesos,alturas e QI’s das pessoas numa população também já foram modelados com sucesso poresta distribuição. A distribuição Normal tem a forma de um sino, e possui dois parâmetros,µ e σ2.

A distribuição Normal é também chamada de Gaussiana em homenagem ao matemáticoCarl Friederich Gauss (1777 - 1855), que a utilizou pela primeira vez na modelagem de errosde medida. A distribuição Normal também funciona como uma boa aproximação para outrasdensidades. Por exemplo, sob algumas condições pode-se provar que a densidade Binomialpode ser aproximada pela Normal.

Definição 8.3 (Densidade Normal com média µ e variância σ2). Seja X uma

variável aleatória contínua definida nos números reais. Dizemos que X tem densidadeNormal com média µ e variância σ2 se a densidade de X é:

f(x) =1√2πσ

e−1

2(x−µ

σ)2 .

Notação: X ∼ N(µ, σ2)

Devemos dizer que o primeiro parâmetro, µ (lê-se: mi), é a média ou o valor esperadode X, enquanto que o segundo parâmetro, σ2 (lê-se: sigma dois), é a variância de X. Aseguir exibimos gráfico das distribuições Normais com média zero e variâncias 1, 2 e 4.

(Esboçar o gráfico de Distribuições Normais com média zero e variâncias

1, 2 e 4)

Note que o máximo das densidades é encontrado quando x = 0, isto é, quando x éigual à média da distribuição. Isto vale para qualquer distribuição Normal: o máximo def(x) é obtido fazendo-se x = µ, onde µ é a média da Normal. Também, quanto maior ovalor da variância σ2, mais “espalhada” é a distribuição.

82

Page 83: Probab Il i Dade

8.3.1 Propriedades da Distribuição Normal

(1) f(x) dada pela expressão acima integra a 1, ou seja, a área sob a curva da normal éigual a 1.

(2) f(x) ≥ 0, para qualquer valor real.

(3) Os limites de f(x) quando x tende a −∞ e +∞ são iguais a zero.

(4) A densidade N(µ, σ2) é simétrica em torno de µ, ou seja: f(µ + x) = f(µ − x).

(5) O valor máximo de f(x) ocorre em x = µ.

(6) Os pontos de inflexão de f(x) são x = µ − σ e x = µ + σ.

Teorema 8.1. Se X ∼ N(µ, σ2), então a variável aleatória definida por

Z =X − µ

σ∼ N(0, 1),

tem distribuição normal reduzida ou normal padrão.

Observações:

1) Se quisermos calcular a probabilidade de P (a < X < b), onde X ∼ N(µ, σ2),devemos resolver a seguinte integral:

P (a < X < b) =

∫ b

a

1√2πσ

e−1

2(x−µ

σ)2dx,

a qual não apresenta fácil solução. Por isso, a solução é reduzir (ou transformar) a variávelX para uma variável:

Z =X − µ

σ,

que tem distribuição normal padrão, e, assim obter a probabilidade de interesse na Tabelada distribuição Normal Padrão.

2) Uma das Tabelas da distribuição Normal Padrão apresenta a seguinte probabi-lidade:

P (0 < Z < z) =

∫ z

0

1√2π

e−x2

2 dx

onde z é um valor real positivo.

A probabilidade dada por P (0 < Z < z) corresponde a seguinte área:

(Esboçar o gráfico representando a área referente a P (0 < Z < z))

83

Page 84: Probab Il i Dade

3) Uma outra Tabela da distribuição Normal Padrão apresenta a seguinte proba-bilidade:

P (−∞ < Z < z) =

∫ z

−∞

1√2π

e−x2

2 dx

onde z é um valor real qualquer.

A probabilidade dada por P (−∞ < Z < z) corresponde a seguinte área:

(Esboçar o gráfico representando a área referente a P (−∞ < Z < z))

8.3.2 Exemplos do Uso da Tabela Normal Padrão

1. Considere X : N(100, 25), calcular:

a) P (100 ≤ X ≤ 106)

b) P (89 ≤ X ≤ 107)

c) P (112 ≤ X ≤ 116)

d) P (X ≥ 108)

2. Sendo X : N(50, 16), determinar xα, tal que:

a) P (X ≤ xα) = 0, 05

b) P (X ≥ xα) = 0, 99

84

Page 85: Probab Il i Dade

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus IUNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICADisciplina: Probabilidade e Estatística (6 créditos) Período 2009.2Prof. Gilberto Matos e Areli MesquitaAluno(a): .

9a LISTA DE EXERCÍCIOS

Distribuição Normal

1 ) Se a variável Z tem distribuição normal padrão, isto é, Z ∼ N(0; 1), obtenha:

a) P (0 ≤ Z ≤ 1, 96);

b) P (Z < 1, 64);

c) P (Z < −2, 57);

d) o valor z, na tabela da normal padrão, tal que, P (Z < z) = 0, 025.

Resp.: a)

2 ) Seja X uma v.a, tal que, X ∼ N(100; 25), determinar:

a) P (X ≥ 108);

b) P (X = 100);

c) P (89 ≤ X ≤ 107);

d) P (12 < X − µ < 16);

e) P (112 < X < 116);

f) P (X < 100 ou X > 106);

Resp.: a)

3 ) Uma v.a X tem Distribuição Normal, com média 50 e desvio padrão 10, i.é, X ∼N(50; 102), determine o valor de A, B e C, nos seguintes casos:

a) P(X > A) = 0, 0228;

b) P(X < B) = 0, 0668;

c) P(|X − µ| < C) = 0, 6826;

Resp.: a)

85

Page 86: Probab Il i Dade

4 ) Uma fábrica de carros sabe que a duração (X) dos motores de sua fabricação temdistribuição aproximadamente normal, com média de 150.000 km e desvio padrão de5.000 km, ou seja, X ∼ N(150.000; 5.0002). Qual a probabilidade de que um carro,escolhido ao acaso, dos fabricados por essa firma, tenha um motor que dure:

a) menos de 170.000 km?

b) entre 140.000 km e 165.000 km?

c) se a fábrica substitui o motor que apresenta duração inferior à garantia (g),qual deve ser esta garantia, para que a porcentagem de motores substituídosseja inferior a 0, 2%?

Resp.: a)

5 ) Foi feito um estudo sobre a altura (X) dos alunos de uma faculdade, observando-seque ela se distribuia com média 160 cm e variância 64 cm2. Determinar:

a) P (X ≤ 176) ;

b) P(|X − 160| ≤ 8) ;

c) a porcentagem dos alunos com altura acima de 180 cm.

Resp.: a)

6 ) Um fabricante de máquinas de lavar sabe, por longa experiência, que a duraçãode suas máquinas tem distribuição normal com média 1000 dias e desvio padrãode 200 dias. Se este fabricante oferece uma garantia de 1 ano (365 dias) e produzmensalmente 2000 máquinas, quantas máquinas ele espera trocar pelo uso da garantiadada, mensalmente?

7 ) Avaliou-se que o tempo médio desperdiçado em cirurgias de longa duração (mais de4 horas) é uma variável aleatória Normal com média de 90 min. e desvio padrão de50 min.

a) Qual é a probabilidade de uma determinada cirurgia ter um desperdício de tempode mais de 60 min. ?

b) Qual é a probabilidade de haver um desperdício de tempo de no máximo 50min.?

c) 15% das cirurgias tem um tempo de desperdício muito alto. Acima de que valoresse tempo é considerado muito alto?

d) Em 100 cirurgias de longa duração realizadas em um certo mês, quantas espe-ramos encontrar com um desperdício superior a 2 horas?

e) Em um determinado dia, foram realizadas 4 cirurgias de longa duração. Qual éa probabilidade de nenhuma ter tido um desperdício superior a 50 min.?

f) Cada hora ou fração da hora desperdiçada em uma cirurgia custa ao hospitalR$ 56,00. Sabendo que acima de 2 horas de desperdício o prejuízo é fixo novalor de R$ 200,00, obtenha o prejuízo esperado.

86

Page 87: Probab Il i Dade

8 ) Numa fábrica foram instaladas 1.000 lâmpadas novas. Sabe-se que a duração médiadas lâmpadas é de 800 horas e desvio padrão de 100 horas, com distribuição normal.Qual a quantidade de lâmpadas que durarão:

a) menos de 500 horas;

b) mais de 700 horas;

c) entre 516 e 814.

Resp.: a)

9 ) O preço de um produto se distribui normalmente com preço médio µ e desvio padrãoσ. Sabe-se que 81,98% dos preços estão situados entre (µ−10) e (µ+10), sendo que,42,07% dos preços são superiores a 600g. Baseado nessas informações, determine µe σ. Resp.: a)

10 ) A vida útil (em anos) de um computador pessoal tem distribuição aproximadamentenormal com média de 2,9 anos e desvio padrão de 1,96 anos.

a) Que proporção dos computadores falhará no primeiro ano?

b) Que proporção dos computadores durará quatro anos ou mais?

c) Que proporção dos computadores durará no mínimo dois anos?

d) Que proporção dos computadores durará mais de 2,5 anos, porém menos dequatro anos?

e) Se o fabricante adota uma política de garantia segundo a qual apenas 5% doscomputadores têm de ser substituídos, qual é o período dessa garantia?

Resp.: a)

11 ) Mostre que, em qualquer distribuição normal, a área sob a curva, determinada pelosintervalos abaixo, é sempre a mesma e independe dos parâmetros da distribuição:

a) (µ − σ; µ + σ);

b) (µ − 2σ; µ + 2σ);

c) (µ − 3σ; µ + 3σ);

Esboce um gráfico para cada uma dessas situações.

Resp.: a)

87

Page 88: Probab Il i Dade

Respostas a serem confirmadas

1 ) a) 0, 0547 = 5, 47%

b) 0%

c) 0, 9053 = 90, 53%

d) 0, 0075 = 0, 75%

e) 0, 6151 = 61, 51%

2 ) a) A = 70;

b) B = 35;

c) C = 10.

3 ) a) 0, 999968 = 99, 99% ∼= 100%

b) 0, 976 = 97, 6%

c) g = 135.650 km

4 ) a) 97, 72%

b) 68, 26%

c) 0, 62%

5 ) a) 1, 4 ∼= 1

b) 841, 3 ∼= 841

c) 553, 4 ∼= 553

88

Page 89: Probab Il i Dade

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus IUNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICADisciplina: Probabilidade e Estatística (6 créditos) Período 2009.2Prof. Gilberto Matos e Areli MesquitaAluno(a): .

10a NOTA DE AULA

9 Variáveis Aleatórias Bidimensionais

9.1 Variáveis Aleatórias Discretas

Na maioria das situações dificilmente trabalhamos com apenas uma variável aleatória. Émuito comum estarmos interessados no comportamento conjunto de várias variáveis aleató-rias. Trataremos aqui apenas de duas variáveis, porém, os conceitos estudados aqui podemser expandidos de maneira análoga para mais de duas variáveis.

Introduziremos o estudo através do seguinte exemplo:

Uma amostra de 20 alunos do primeiro ano de uma faculdade foi escolhida. Perguntou-se aos alunos se trabalhavam, variável que foi representada por X, e o número de vestibu-lares prestados, variável representada por Y . Os dados obtidos estão na tabela abaixo.

X não sim não não não sim sim não sim simY 1 1 2 1 1 2 3 1 1 1

X não não sim não sim não não não sim nãoY 2 2 1 3 2 2 2 1 3 2

Podemos coletar as freqüências de ocorrência dos possíveis pares, construindo uma tabelade freqüência conjunta de X e Y .

(X, Y ) freqüência

Total

Esta mesma tabela pode ser apresentada de maneira mais conveniente através databela de dupla entrada, da seguinte forma:

89

Page 90: Probab Il i Dade

X | Y Total

Total

Dessa forma, fica facilitada a tarefa de obter a tabela de freqüência individual paracada variável que, pela posição em que seus valores aparecem na tabela de dupla entrada, échamada de tabela marginal de freqüência da variável X (ou Y ), ou simplesmente marginalde X (ou Y ). Temos então para as variáveis X e Y , do exemplo anterior, as seguintestabelas de freqüência:

X freqüência

Total

Y freqüência

Total

Observe que podemos construir as mesmas tabelas considerando as freqüências relati-vas.

9.1.1 Função de Probabilidade Conjunta

Iremos considerar agora o caso de variáveis aleatórias discretas, definidas a partir das suasfunções de probabilidades. Iniciamos estendendo a definição de função de probabilidadepara o caso de duas variáveis.

Definição 9.1 (Função de probabilidade conjunta(bidimensional)). Seja X

uma variável aleatória que assume os valores x1, x2, ..., xm e Y variável aleatória queassume os valores y1, y2, ..., yn. A função de probabilidade conjunta é definida,para todos os possíveis pares de valores (xi, yj), i = 1, 2, ..., m e j = 1, 2, ..., n, daseguinte forma:

p(xi, yj) = P [(X = xi) ∩ (Y = yj)] = P (X = xi, Y = yj),

isto é, p(xi, yj) representa a probabilidade de (X, Y ) ser igual a (xi, yj).

Definição 9.2 (Distribuição conjunta(bidimensional) de probabilidades). Ao

conjunto de pares

(xi, yj), p(xi, yj), i = 1, 2, ..., m j = 1, 2, ..., n,

damos o nome de distribuição conjunta de probabilidades da variável aleatória bidimen-sional (X, Y ), onde:

m∑

i=1

n∑

j=1

p(xi, yj) = 1

90

Page 91: Probab Il i Dade

A distribuição conjunta de probabilidades da variável (X, Y ) pode ser representada,também, através de uma tabela de dupla entrada.

Exemplo 3. Uma região foi subdividida em 10 sub-regiões. Em cada uma delas, foramobservadas duas variáveis: número de poços artesianos (X) e número de riachos ourios presentes na sub-região (Y ). Os resultados são apresentados na tabela a seguir:

Sub-região 1 2 3 4 5 6 7 8 9 10X 0 0 0 0 1 2 1 2 2 0Y 1 2 1 0 1 0 0 1 2 2

Considerando que escolhemos uma das sub-regiões ao acaso, isto é, cada sub-regiãotem mesma probabilidade 1/10 de ser escolhida, podemos construir a distribuição deprobabilidades conjunta de (X, Y ), tal como:

(X, Y ) P (X, Y )

Total

Cuja tabela de dupla entrada é dada por:

X | Y Total

Total

9.1.2 Distribuições Marginais de Probabilidades

Quando trabalhamos com uma variável aleatória bidimensional podemos ter o interesse emestudar o comportamento de uma única variável; ou seja; em conhecer a distribuição deprobabilidade de X ou de Y . Para isto precisamos considerar a distribuição de probabilidadesconjunta de (X, Y ) representada em uma tabela de dupla entrada, tal como:

91

Page 92: Probab Il i Dade

Tabela 1: tabela de dupla entrada para apresentar a distribuição conjunta de (X,Y).

Y y1 ... yn

X Totalx1 p(x1, y1) ... p(x1, yn) p(x1)x2 p(x2, y1) ... p(x2, yn) p(x2)... ... ... ... ...... ... ... ... ...xm p(xm, y1) ... p(xm, yn) p(xm)

Total p(y1) ... p(yn) 1,0

Desta maneira, a distribuição de X ou comumente denominada de distribuição marginalde X, pode ser obtida a partir de

p(xi) = P [(X = xi, Y = y1)ou(X = xi, Y = y2)ou...ou(X = xi, Y = yn)] = Σnj=1p(xi, yj).

De modo análogo, a distribuição marginal de Y é obtida a partir de

p(yj) = P [(X = x1, Y = yj)ou(X = x2, Y = yj)ou...ou(X = xm, Y = yj)] = Σmi=1p(xi, yj).

Exemplo 4. Considerando o exemplo das sub-regiões, podemos calcular, através dadistribuição conjunta, as seguintes distribuições marginais:

X = xi 0 1 2P (X = xi)

Y = yj 0 1 2P (Y = yj)

9.1.3 Função de Variáveis Aleatórias

Em algumas situações poderá surgir o interesse em estudar o comportamento de umafunção das variáveis aleatórias, tal como: soma, produto ou alguma outra relação entreelas. Para melhor compreender os procedimentos para se realizar tal estudo, consideremoso seguinte exemplo:

Em uma cidade do Estado de São Paulo, admite-se que o número de anos para com-pletar o ensino fundamental (variável F ) e o número de anos para completar o ensino médio(variável M) têm distribuição conjunta dada por:

(F, M) p(f, m)(8,3) 3/10(8,4) 1/10(8,5) 1/10(9,3) 2/10(9,4) 1/20(9,5) 1/10(10,4) 1/10(10,5) 1/20Total 1

92

Page 93: Probab Il i Dade

Suponha agora que exista o interesse em estudar as variáveis F + M e F.M . Paraisto, podemos acrescentar, à tabela anterior, algumas colunas correspondentes aos valoresdessas novas variáveis. Vejamos:

(F, M) p(f, m) F + M F.M(8,3) 3/10(8,4) 1/10(8,5) 1/10(9,3) 2/10(9,4) 1/20(9,5) 1/10(10,4) 1/10(10,5) 1/20

Através dessa tabela podemos construir a distribuição da variável Z = F + M eW = F.M , para isso basta somar as probabilidades nos valores comuns, por exemplo:

P (Z = 13) = P (8, 5) + P (9, 4) =1

10+

1

20=

3

20.

Procedendo de modo similar com os outros valores obtemos as funções de probabilidadede Z e de W :

Z = z 11 12 13 14 15P (Z = z)

W = w 24 27 32 36 40 45 50P (W = w)

9.1.4 Associação entre Variáveis

Definição 9.3 (Probabilidade condicional). Dada duas variáveis aleatórias dis-

cretas definidas no mesmo espaço amostral, a probabilidade condicional de X = x,dado que Y = y ocorreu, é dada pela expressão:

P (X = x | Y = y) =P (X = x, Y = y)

P (Y = y), se P (Y = y) > 0.

Caso P (Y = y) = 0, a probabilidade condicional pode ser definida arbitrariamentee adotaremos P (X = x | Y = y) = P (X = x).

93

Page 94: Probab Il i Dade

Definição 9.4 (Variáveis aleatórias independentes). Duas variáveis aleatórias

discretas são independentes, se a ocorrência de qualquer valor de uma delas não alteraa chance de ocorrência de valores da outra. Ou seja,

P (X = x | Y = y) = P (X = x),

para todos os possíveis valores (x, y) das variáveis (X, Y ). Como definição alternativapodemos usar:

P (X = x, Y = y) = P (X = x)P (Y = y),

para quaisquer (x, y).

Observação: X e Y são independentes ⇐⇒ p(x, y) = p(x)p(y), ∀ (x, y).

Se existe pelo menos um par (x0, y0) tal que:

p(xo, y0) 6= p(x0)p(y0)

então, X e Y não são independentes.

Exemplo 5. Suponhamos que X e Y tenham distribuição conjunta dada pela seguintetabela:

X | Y 1 2 31 0 1/5 02 1/5 1/5 1/53 0 1/5 0

Determine as distribuiçãoes marginais de X e Y e verifique se estas variáveis sãoindependentes.

9.1.5 Medida de Correlação entre duas Variáveis

Quando as variáveis não são independentes isto quer dizer que existe uma certa relação entreas variáveis. Esta relação pode ser de qualquer tipo, como por exemplo uma relação linear,quadrática, exponencial, etc. Nosso objetivo aqui não será o de determinar qual o tipode relação que existe entre as variáveis em questão e sim o de medir o grau de correlaçãoentre as variáveis. Neste curso iremos medir o grau de correlação linear entre variáveisquantitativas discretas. Na literatura existem outras medidas de correlação, inclusive entrevariáveis qualitativas, porém este não será o nosso objetivo neste curso.

Antes de definirmos a medida de correlação linear entre as variáveis vamos enunciaralgumas propriedades envolvendo o valor esperado de funções de variáveis aleatórias.

94

Page 95: Probab Il i Dade

Propriedade 1: Para variáveis aleatórias X e Y , vale sempre que

E(X + Y ) = E(X) + E(Y ).

No caso do produto de duas variáveis aleatórias nem sempre é válido que o valoresperado do produto é o produto dos valores esperados. Neste caso temos o seguinteresultado:

Propriedade 2: Se X e Y são duas variáveis aleatórias independentes, então

E(XY ) = E(X)E(Y ).

Obs: A recíproca desta propriedade não é verdadeira, ou seja, se

E(XY ) = E(X)E(Y ),

então não necessariamente é verdade que X e Y são independentes.

Exemplo 6. Considere as variáveis X e Y tendo distribuição conjunta dada por:

X | Y 2 3 4-1 2/12 0 3/120 0 1/12 1/121 1/12 2/12 2/12

Calcule, E(X), E(Y ) e E(XY ). Depois determine se X e Y são independentes.

Definição 9.5. Uma medida de dependência linear entre X e Y é dada pela covari-

ância:Cov(X, Y ) = E[(X − E(X))(Y − E(Y ))].

Em palavras, a covariância é o valor esperado do produto dos desvios de cada variávelem relação à sua média.

Desenvolvendo a equação acima chegaremos em uma definição mais usual, que é dadapela seguinte expressão:

Cov(X, Y ) = E(XY ) − E(X)E(Y ).

Observe que, se X e Y são independentes, então a Cov(X, Y ) = 0; mas a recíprocanem sempre é verdadeira.

A partir da covariância, definimos uma nova medida de dependência linear.

95

Page 96: Probab Il i Dade

Definição 9.6 (Coeficiente de correlação linear). O coeficiente de correlação

linear entre as variáveis aleatórias X e Y é calculado pela seguinte expressão:

ρX,Y =Cov(X, Y )

σXσY

.

Onde, σX e σY são respectivamente os desvios-padrão das variáveis X e Y .

A divisão pelo produto dos desvios-padrão, tem a função de padronizar a medida etornar possível a comparação com outras variáveis. Pode-se mostrar que |ρX,Y | ≤ 1. Ainterpretação de sua expressão segue os mesmos passos da covariância, sendo que valoresde ρX,Y próximos de ±1 indicam correlação forte.

Propriedade 3: Sejam X e Y variáveis aleatórias quaisquer, então

V ar(X + Y ) = V ar(X) + V ar(Y ) + 2Cov(X, Y ).

Se X e Y são independentes, então

V ar(X + Y ) = V ar(X) + V ar(Y ).

Exemplo 7. Calcule a Cov(F, M) e ρF,M onde F e M são as variáveis aleatóriasencontradas na Sub-sub-Seção 9.1.3.

96

Page 97: Probab Il i Dade

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus IUNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICADisciplina: Probabilidade e Estatística (6 créditos) Período 2009.2Prof. Gilberto Matos e Areli MesquitaAluno(a): .

10a LISTA DE EXERCÍCIOS

1 - O setor de emergência de um pronto socorro infantil anotou o número de criançasatendidas (C), de médicos (M) e de auxiliares (A) de plantão em 15 dias de atividades.Os dados são apresentados na tabela abaixo:

Dia 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15C 5 7 5 6 5 5 7 5 6 6 7 5 5 6 6M 1 1 2 2 2 1 2 1 1 2 2 2 2 2 2A 4 4 5 6 7 7 6 5 5 6 7 7 6 6 7

a) Determine as tabelas de freqüência marginais de C, M e A.

b) Obtenha a tabela de freqüência conjunta entre (C, M), (C, A) e (M, A).

c) Calcule a média das variáveis M e A.

2 - Para famílias de um certo bairro de São Paulo, apresentamos abaixo a tabela defreqüência conjunta das variáveis: número de automóveis (A) e de TVs (T).

A\ T 0 1 2 total0 110 235 120 4651 51 122 178 3512 15 84 162 261

total 176 441 460 1077

a) Calcule as marginais de A e T.

b) Determine as médias destas variáveis.

3 - Uma moeda equilibrada é lançada duas vezes de forma independente. Ao final doslançamentos, duas variáveis aleatórias são anotadas: o número total de caras (C) eo número de coroas no 2ž lançamento (K).

a) Construa uma tabela com a distribuição conjunta das variáveis C e K.

b) Determine o valor esperado de C.

4 - A função conjunta de probabilidade entre as variáveis X e Y é apresentada abaixo(com algumas entradas faltando):

X\ Y -1 0 2 4 P (X)-2 3/64 1/32 5/16-1 1/16 1/16 01 1/64 11/64 1/64 5/162 5/64 3/64 1/32

P (Y ) 5/16 1/4 1

97

Page 98: Probab Il i Dade

a) Complete a tabela.

b) X e Y são independentes?

c) Obtenha as marginais de X e Y.

d) Calcule a distribuição da variável W = XY.

e) Calcule ρ(X, Y ).

5 - A função de probailidade conjunta entre as variáveis aleatórias X e Y é apresentadana tabela abaixo:X\ Y -2 0 2 4

-1 0,1 0,2 0,1 0,21 0,2 0 0,1 0,1

a) Obtenha as distribuições marginais de X e Y.

b) X e Y são independentes?

c) Calcule ρ(X, Y ).

6 - Na caixa I existem duas bolas numeradas 0 e 1, enquanto que a caixa II contêm duasbolas numeradas -1 e 0. Uma bola é retirada aleatoriamente de cada caixa, de formaindependente uma da outra. A esse experimento, associamos as variáveis aleatórias:número da bola retirada na caixa I (X), soma dos valores das duas bolas retiradas(Y ) e a diferença, em módulo, desses valores (Z).

a) Determine a distribuição de probabilidade conjunta entre Xe Y e entre Y e Z.

b) Verifique se Xe Y são independentes. Idem para Y e Z.

c) Calcule a Cov(X, Y ) .

d) Obtenha V ar (X + Y ) .

7 - A variável X é Bernoulli com p = 0, 4 e Y : b(3 : 0, 5). Admita que X e Y sãoindependentes.

a) Determine P (X = 0 | Y = 2) .

b) Obtenha a distribuição conjunta de Xe Y e do produto W = XY.

c) Clcule E (X) , E (Y ) e E (W ) e verifique que E (W ) = E (X) E (Y ) .

d) Determine o valor de Cov(X, Y ) e ρ (X, Y ) .

98

Page 99: Probab Il i Dade

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus IUNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICADisciplina: Probabilidade e Estatística (6 créditos) Período 2009.2Prof. Gilberto Matos e Areli MesquitaAluno(a): .

Relação de Exercícios para o 3 Estágio

Livro: "Estatística Básica". Wilton O. Bussab e Pedro A. Morettin. 5a. Edicão.

Capítulo 6 (Modelos de variáveis aleatórias discretas):

Problema Página22, 23 e 24 152

32 e 34 15737 15840 15951 160

Capítulo 7 (Modelos de variáveis aleatórias contínuas):

Problema Página13 182

19 e 20 18335 19540 196

Capítulo 8 (Variáveis aleatórias multidimensionais - caso discreto e bidi-mensional):

Problema Página2 e 3 2064 e 5 20910 21013 21517 216

99

Page 100: Probab Il i Dade

EXERCÍCIOS EXTRAS

1 - Por engano 3 peças defeituosas foram misturadas com peças boas formando um lotede 12 peças no total. Escolhendo, ao acaso, 4 dessas peças, determine a probabilidadede encontrar:

a) Pelo menos 2 defeituosas.

b) No máximo 1 defeituosa.

c) No mínimo uma boa.

2 - Em um estudo sobre o crescimento de jacarés, uma pequena lagoa contém 4 exem-plares da espécie A e 5 da espécie B. A evolução de peso e tamanho dos 9 jacarés dalagoa é acompanhada pelos pesquisadores através de capturas periódicas. Determinea probabilidade de, em três jacarés capturados, obtermos:

a) Todos da espécie A.

b) Nem todos serem da espécie B.

c) A maioria ser da espécie A.

3 - Admite-se que uma pane pode ocorrer em qualquer ponto de uma rede elétrica de 10quilômetros.

a) Qual é a probabilidade da pane ocorrer nos primeiros 500 metros? E de ocorrernos 3 quilômetros centrais da rede?

b) O custo de reparo da rede depende da distância do centro de serviço ao local dapane. Considere que o centro de serviço está na origem da rede e que o custo éde R$ 200 para distâncias até 3 quilômetros, de R$ 400 entre 3 e 8 quilômetrose de R$ 1.000 para distâncias acima de 8 quilômetros. Qual é o custo médio doconserto?

4 - Suponha que o valor esperado de uma variável aleatória com distribuição Uniformecontínua é igual a 1 e a variância é 1/12. Encontre a probabilidade da variável assumirvalores menores que 3/4.

5 - O tempo necessário para um medicamento contra dor fazer efeito foi modelado deacordo com a densidade Uniforme no intervalo de 5 a 15 minutos, tendo por baseexperimentos conduzidos em animais. Um paciente, que esteja sofrendo dor, recebe oremédio e, supondo válido o modelo mencionado acima, pergunta-se a probabilidadeda dor:

a) Cessar em até 10 minutos?

b) Demorar pelo menos 12 minutos?

c) Durar mais de 7 minutos, sabendo-se que durou menos de 10?

6 - O tempo, em minutos, de utilização de um caixa eletrônico por clientes de um certobanco, foi modelado por uma variável aleatória T com distribuição Exponencial cujamédia é igual a 1/3. Determine:

100

Page 101: Probab Il i Dade

a) P(T < 1).

b) P(T > 1 | T > 2).

c) Um número a tal que P(T < a) = 0,4.

7 - Para uma variável aleatória com distribuição Exponencial de parâmetro igual a 1,determine a probabilidade de sorteamos um valor que se distancie no máximo 0,5 damédia.

101