Inferência Indutiva Uma Perspectiva Genuinamente Bayesiana

Inferência IndutivaUma Perspectiva

Genuinamente Bayesiana

Carlos Alberto de Bragança Pereira

Inferência Bayesiana 2007

Aula 1

04/19/23 2

The Statistician is the Wizard who makes "scientific"

statements about invisible states and quantities.

However, contrary to real wishes (and witches), (s)he

attaches uncertainties to h(er)is statements."

04/19/23 3

ProbabilidadesO trabalho do estatístico é iniciado no momento da

descrição dos níveis de incerteza de um cientista sobre

as quantidades de interesse (invisíveis), .

A ferramenta usada para a descrição do nível de

incerteza sobre é a Probabilidade. A Probabilidade de um estado de natureza específico,

digamos , é um índice que indica o nível de

incerteza (ou conhecimento) sobre a veracidade

da afirmação: ¨ é igual a ¨

04/19/23 4

Variáveis AleatóriasNosso objetivo é descrever nossas incertezasProbabilisticamente. Às quantidadesdesconhecidas de nosso interesse damos o nomede Variáveis Aleatórias e podem ser de 3 tipos:

-as observadas-as não observadas e-as não observáveis.

As não observáveis e de interesse damoso nome de Parâmetros.

04/19/23 5

Modelo Probabilístico

Probabilidades devem ser atribuídas a todos

os estados de natureza possíveis. Ao conjunto

de todas as afirmações probabilísticas de um

problema usamos o termo

modelo probabilístico

ou equivalentemente

distribuição de probabilidades.

04/19/23 6

Experimento & Banco de Dados

O mecanismo que transforma uma quantidade

invisível, X, em visível, x, é aqui denominado

experimento.O conjunto de quantidades obtidas após a

realização de experimentos é denominado

resultados experimentais ou

banco de dados.

04/19/23 7

a priori & a posterioriA realização de um experimento {X=x}

tem como objetivo a redução da incerteza sobre o parâmetro de interesse .

O modelo probabilístico de , definidoantes (depois) da realização do

experimento X, é denominado a priori (a posteriori) de .

04/19/23 8

AssociaçãoMuitas vezes o cientista enfrenta um dilema:

O que observar para diminuir a incertezasobre ? Ele pode estar em presença de um

conjunto de experimentos, digamosX,Y,Z,..., passíveis de serem observados.

Pode haver custos ou restrições associadosà realização dos experimentos.

Assim, o estatístico é obrigado aselecionar quais serão observados.

04/19/23 9

Associação

Para uma escolha adequada, ele devedescrever o tipo de associação que,

em sua opinião, existe entre e cada um dos experimentos.

Essa descrição também é feita pormeio de modelos probabilísticos.

Por exemplo, considere que oexperimento X vai ser realizado.

04/19/23 10

AssociaçãoPara cada valor, do parâmetro, represente por f(x|) a função de probabilidade que avalia, paracada x, a probabilidade de {X=x}. Se existempelo menos dois valores de , digamos 1 e 2,tal que f(.|1 ) f(.|2 ), então e X sãodependentes ou associados.

Neste caso é razoável realizar-se o experimentoX com o intuito de diminuir a incerteza sobre .

& X : conjuntos de valores possíveis de e X, os conhecidos espaços paramétrico e amostral.

04/19/23 11

Instrumental

Dist. a priori: P

Modelo Estatístico: {P(,x): xX, }.

Dist. Amostral: {f(x|): xX.

Verossimilhança:x{L(|x) = f(x|): } xX.

Dist a posteriori:{P(|X=x): } xX.

04/19/23 12

Exemplo 1: BioEquivalência

Uma nova droga para enxaquecatenta entrar no mercado.

O laboratório afirma que é equivalente a melhordroga da praça, cujo efeito positivo é de 75%.

Além disso a nova droga sairá mais baratopara o consumidor. Em média 60% mais barato!

Uma pesquisa com 30 pacientes foirealizada e apenas 9 desses não

responderam positivamente a nova droga.

04/19/23 13

Análise PadrãoDistribuição Amostral-Binomial (n=30, =.75):

MLE = .7, IC = [.5412;.8526] com C=95% & p-value =52.8%

10 12 14 16 18 20 22 24 26 28 30

Central

Caudas

.311

04/19/23 14

BayesianPosterior or Likelihood:

mean=.69, mode = .7, median=.691,95% cred. interval [.529;.821], Tx= [.65;.75] & ev=52.8%

0,3 0,4 0,5 0,6 0,7 0,8 0,9 1

TX

Credibility

Caudas

Unif. Prior

.292

04/19/23 15

Planejamento de Experimentos

Quais quantidades devem ser observadas? As que podem gerar maior ganho de informação!

Decisão antes de realizar e observar. Escolha é feita com base nas expectativas sobre

resultados dos experimentos concorrentes.Essa análise de expectativas, é identificada como

o clássico Planejamento de Experimentos.

Procuram-se os planejamentos “ótimos”. Podem ser não realizáveis devido as

restrições operacionais ou de custos.

04/19/23 16

Estimação: Formulação

Obter a posteriori é o nosso objetivo maior Após coletar as informações disponíveis em

x sobre o estatístico descreve ainformação calibrada sobre a posteriori.

Como então melhor predizer ? A resposta é estudada com o nome de

teoria da estimação. Mais geralmentepela teoria da decisão. De posse da

posteriori, fxdecidimos então comomelhor predizer .

04/19/23 17

Estimação: Solução

Consideramos características de fx tais como média, mediana ou moda,

dependendo da logística usada. Esse é otrabalho de estimação pontual.

Por estimação intervalar entendemosa procura, do menor conjunto que, comprobabilidade fixada (95%), contenha

Conjunto de Credibilidade.

04/19/23 18

Teste de Significancia: Formulação

Por teste de significância entendemos

uma avaliação da consistência de uma

hipótese , sobre com o os dados, x.

Entendemos que todo procedimento estatístico

deve basear-se tão somente na posteriori fx

Por hipótese entendemos uma afirmação do tipo

“o parâmetro pertence ao subconjunto

”.

04/19/23 19

Teste de Significancia: Solução

Hipótese (não) precisa dim (=) < dim

No caso não preciso,o valor de Px é um

bom avaliador da consistência entre H & x.

Nosso foco limita-se ao caso

dim < dim das hipóteses precisas.

Introduzimos o conceito de evidência

contra ou a favor da hipótese H avaliada.

04/19/23 20

Full Bayesian Significance Test: FBST

Evidência contra a hipótese:

1-ev = Pr(Tx), onde Tx é tal que,

t Tx e fx(t) > fx .

Tx é a tangente (relativa a x) de

ev alto devemos aceitar .

Caso contrário, rejeitar !

04/19/23 21

Regras

L1-Convexidade: 0<P(A|H)<1 e P(H|H)=1.

L2-Adição:

P(A ou B|H) = P(A|H)+P(B|H) se A e B são exclusivos.

L3-Multiplicação:

P(A e B|H) = P(A|H)P(B|A e H).

Uma extensão da lei número 2 é apresentada a seguir. Entretanto não é conseqüência de conceitos simples Note que nenhuma das 3 leis pode ser deduzida das outras.

• L2’. Adição enumerável:

Seja {(,...,An,...)} um

conjunto enumerável de

eventos mutuamente

exclusivos. Então,

• P(Ai|H)=P(Ai|H)

04/19/23 22

Teorema da Probabilidade Total

x

x

HexXyYHxX

HyYxXHyY

}|Pr{}|Pr{

}|,Pr{}|Pr{

04/19/23 23

Fórmula de Bayes

H}.exy|XP{Yy|H}P{Yx|H}P{X

y|H}P{Yy|H}x,YP{X

y,H}x|YP{X

dt)t|x(f)t(g

)|x(f)(g)x|(g

04/19/23 24

Bibliography-David Blackwell (1969), Basic Statistics, McGraw-Hill.

(Theory of Games & Statisticcal Decisions)-Morris DeGroot (1986), Probability & Statistics, Adison-Wesley

(Decision Theory)-Bruno De Finetti (1972), Probability, induction, and statistics, Wiley.

(Theory of Probability, 2 volumes)- Oscar Kempthorne & L Folks (1971), Probability, Statistics &

Data Analysis, Iowa University Press.- Dev Basu (1988), Statistical Information & Likelihood: A Collection

Of Critical Essays, JK Gosh editor,Springer-Verlag. Lecture Notes in Statistics #45

- IJ Good (1983), Good Thinking, U. Minnesota Press.- Richard Barlow (1998), Engineering Reliability, SIAM- Paulino, Turkman & Murtrera (2003), Estatística Bayesiana.

Fundação Calouste Gulberkian - Lisboa

Documents

Inferência Indutiva Uma Perspectiva Genuinamente Bayesiana