Upload
thane-gay
View
41
Download
0
Embed Size (px)
DESCRIPTION
Inferência Indutiva Uma Perspectiva Genuinamente Bayesiana. Carlos Alberto de Bragança Pereira Inferência Bayesiana 2007 Aula 1. The Statistician is the Wizard who makes "scientific" statements about invisible states and quantities . However, contrary to real - PowerPoint PPT Presentation
Citation preview
Inferência IndutivaUma Perspectiva
Genuinamente Bayesiana
Carlos Alberto de Bragança Pereira
Inferência Bayesiana 2007
Aula 1
04/19/23 2
The Statistician is the Wizard who makes "scientific"
statements about invisible states and quantities.
However, contrary to real wishes (and witches), (s)he
attaches uncertainties to h(er)is statements."
04/19/23 3
ProbabilidadesO trabalho do estatístico é iniciado no momento da
descrição dos níveis de incerteza de um cientista sobre
as quantidades de interesse (invisíveis), .
A ferramenta usada para a descrição do nível de
incerteza sobre é a Probabilidade. A Probabilidade de um estado de natureza específico,
digamos , é um índice que indica o nível de
incerteza (ou conhecimento) sobre a veracidade
da afirmação: ¨ é igual a ¨
04/19/23 4
Variáveis AleatóriasNosso objetivo é descrever nossas incertezasProbabilisticamente. Às quantidadesdesconhecidas de nosso interesse damos o nomede Variáveis Aleatórias e podem ser de 3 tipos:
-as observadas-as não observadas e-as não observáveis.
As não observáveis e de interesse damoso nome de Parâmetros.
04/19/23 5
Modelo Probabilístico
Probabilidades devem ser atribuídas a todos
os estados de natureza possíveis. Ao conjunto
de todas as afirmações probabilísticas de um
problema usamos o termo
modelo probabilístico
ou equivalentemente
distribuição de probabilidades.
04/19/23 6
Experimento & Banco de Dados
O mecanismo que transforma uma quantidade
invisível, X, em visível, x, é aqui denominado
experimento.O conjunto de quantidades obtidas após a
realização de experimentos é denominado
resultados experimentais ou
banco de dados.
04/19/23 7
a priori & a posterioriA realização de um experimento {X=x}
tem como objetivo a redução da incerteza sobre o parâmetro de interesse .
O modelo probabilístico de , definidoantes (depois) da realização do
experimento X, é denominado a priori (a posteriori) de .
04/19/23 8
AssociaçãoMuitas vezes o cientista enfrenta um dilema:
O que observar para diminuir a incertezasobre ? Ele pode estar em presença de um
conjunto de experimentos, digamosX,Y,Z,..., passíveis de serem observados.
Pode haver custos ou restrições associadosà realização dos experimentos.
Assim, o estatístico é obrigado aselecionar quais serão observados.
04/19/23 9
Associação
Para uma escolha adequada, ele devedescrever o tipo de associação que,
em sua opinião, existe entre e cada um dos experimentos.
Essa descrição também é feita pormeio de modelos probabilísticos.
Por exemplo, considere que oexperimento X vai ser realizado.
04/19/23 10
AssociaçãoPara cada valor, do parâmetro, represente por f(x|) a função de probabilidade que avalia, paracada x, a probabilidade de {X=x}. Se existempelo menos dois valores de , digamos 1 e 2,tal que f(.|1 ) f(.|2 ), então e X sãodependentes ou associados.
Neste caso é razoável realizar-se o experimentoX com o intuito de diminuir a incerteza sobre .
& X : conjuntos de valores possíveis de e X, os conhecidos espaços paramétrico e amostral.
04/19/23 11
Instrumental
Dist. a priori: P
Modelo Estatístico: {P(,x): xX, }.
Dist. Amostral: {f(x|): xX.
Verossimilhança:x{L(|x) = f(x|): } xX.
Dist a posteriori:{P(|X=x): } xX.
04/19/23 12
Exemplo 1: BioEquivalência
Uma nova droga para enxaquecatenta entrar no mercado.
O laboratório afirma que é equivalente a melhordroga da praça, cujo efeito positivo é de 75%.
Além disso a nova droga sairá mais baratopara o consumidor. Em média 60% mais barato!
Uma pesquisa com 30 pacientes foirealizada e apenas 9 desses não
responderam positivamente a nova droga.
04/19/23 13
Análise PadrãoDistribuição Amostral-Binomial (n=30, =.75):
MLE = .7, IC = [.5412;.8526] com C=95% & p-value =52.8%
10 12 14 16 18 20 22 24 26 28 30
Central
Caudas
.311
04/19/23 14
BayesianPosterior or Likelihood:
mean=.69, mode = .7, median=.691,95% cred. interval [.529;.821], Tx= [.65;.75] & ev=52.8%
0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
TX
Credibility
Caudas
Unif. Prior
.292
04/19/23 15
Planejamento de Experimentos
Quais quantidades devem ser observadas? As que podem gerar maior ganho de informação!
Decisão antes de realizar e observar. Escolha é feita com base nas expectativas sobre
resultados dos experimentos concorrentes.Essa análise de expectativas, é identificada como
o clássico Planejamento de Experimentos.
Procuram-se os planejamentos “ótimos”. Podem ser não realizáveis devido as
restrições operacionais ou de custos.
04/19/23 16
Estimação: Formulação
Obter a posteriori é o nosso objetivo maior Após coletar as informações disponíveis em
x sobre o estatístico descreve ainformação calibrada sobre a posteriori.
Como então melhor predizer ? A resposta é estudada com o nome de
teoria da estimação. Mais geralmentepela teoria da decisão. De posse da
posteriori, fxdecidimos então comomelhor predizer .
04/19/23 17
Estimação: Solução
Consideramos características de fx tais como média, mediana ou moda,
dependendo da logística usada. Esse é otrabalho de estimação pontual.
Por estimação intervalar entendemosa procura, do menor conjunto que, comprobabilidade fixada (95%), contenha
Conjunto de Credibilidade.
04/19/23 18
Teste de Significancia: Formulação
Por teste de significância entendemos
uma avaliação da consistência de uma
hipótese , sobre com o os dados, x.
Entendemos que todo procedimento estatístico
deve basear-se tão somente na posteriori fx
Por hipótese entendemos uma afirmação do tipo
“o parâmetro pertence ao subconjunto
”.
04/19/23 19
Teste de Significancia: Solução
Hipótese (não) precisa dim (=) < dim
No caso não preciso,o valor de Px é um
bom avaliador da consistência entre H & x.
Nosso foco limita-se ao caso
dim < dim das hipóteses precisas.
Introduzimos o conceito de evidência
contra ou a favor da hipótese H avaliada.
04/19/23 20
Full Bayesian Significance Test: FBST
Evidência contra a hipótese:
1-ev = Pr(Tx), onde Tx é tal que,
t Tx e fx(t) > fx .
Tx é a tangente (relativa a x) de
ev alto devemos aceitar .
Caso contrário, rejeitar !
04/19/23 21
Regras
L1-Convexidade: 0<P(A|H)<1 e P(H|H)=1.
L2-Adição:
P(A ou B|H) = P(A|H)+P(B|H) se A e B são exclusivos.
L3-Multiplicação:
P(A e B|H) = P(A|H)P(B|A e H).
Uma extensão da lei número 2 é apresentada a seguir. Entretanto não é conseqüência de conceitos simples Note que nenhuma das 3 leis pode ser deduzida das outras.
• L2’. Adição enumerável:
Seja {(,...,An,...)} um
conjunto enumerável de
eventos mutuamente
exclusivos. Então,
• P(Ai|H)=P(Ai|H)
04/19/23 22
Teorema da Probabilidade Total
x
x
HexXyYHxX
HyYxXHyY
}|Pr{}|Pr{
}|,Pr{}|Pr{
04/19/23 23
Fórmula de Bayes
H}.exy|XP{Yy|H}P{Yx|H}P{X
y|H}P{Yy|H}x,YP{X
y,H}x|YP{X
dt)t|x(f)t(g
)|x(f)(g)x|(g
04/19/23 24
Bibliography-David Blackwell (1969), Basic Statistics, McGraw-Hill.
(Theory of Games & Statisticcal Decisions)-Morris DeGroot (1986), Probability & Statistics, Adison-Wesley
(Decision Theory)-Bruno De Finetti (1972), Probability, induction, and statistics, Wiley.
(Theory of Probability, 2 volumes)- Oscar Kempthorne & L Folks (1971), Probability, Statistics &
Data Analysis, Iowa University Press.- Dev Basu (1988), Statistical Information & Likelihood: A Collection
Of Critical Essays, JK Gosh editor,Springer-Verlag. Lecture Notes in Statistics #45
- IJ Good (1983), Good Thinking, U. Minnesota Press.- Richard Barlow (1998), Engineering Reliability, SIAM- Paulino, Turkman & Murtrera (2003), Estatística Bayesiana.
Fundação Calouste Gulberkian - Lisboa