240 likes | 352 Vues
Inferência Indutiva Uma Perspectiva Genuinamente Bayesiana. Carlos Alberto de Bragança Pereira Inferência Bayesiana 2007 Aula 1. The Statistician is the Wizard who makes "scientific" statements about invisible states and quantities . However, contrary to real
E N D
Inferência IndutivaUma Perspectiva Genuinamente Bayesiana Carlos Alberto de Bragança Pereira Inferência Bayesiana 2007 Aula 1
The Statistician is the Wizard who makes "scientific" statements about invisible states and quantities. However, contrary to real wishes (and witches), (s)he attaches uncertainties to h(er)is statements."
Probabilidades O trabalho do estatístico é iniciado no momento da descrição dos níveis de incerteza de um cientista sobre as quantidades de interesse (invisíveis), q. A ferramenta usada para a descrição do nível de incerteza sobre q é a Probabilidade. A Probabilidade de um estado de natureza específico, digamos q0, é um índice que indica o nível de incerteza (ou conhecimento) sobre a veracidade da afirmação: ¨qé igual aq0¨
Variáveis Aleatórias • Nosso objetivo é descrever nossas incertezas • Probabilisticamente. Às quantidades • desconhecidas de nosso interesse damos o nome • de Variáveis Aleatóriase podem ser de 3 tipos: • as observadas • as não observadas e • as não observáveis. • As não observáveis e de interesse damos • o nome de Parâmetros.
Modelo Probabilístico Probabilidades devem ser atribuídas a todos os estados de natureza possíveis. Ao conjunto de todas as afirmações probabilísticas de um problema usamos o termo modelo probabilístico ou equivalentemente distribuição de probabilidades.
Experimento & Banco de Dados O mecanismo que transforma uma quantidade invisível, X, em visível, x, é aqui denominado experimento. O conjunto de quantidades obtidas após a realização de experimentos é denominado resultados experimentaisou banco de dados.
a priori & a posteriori A realização de um experimento {X=x} tem como objetivo a redução da incerteza sobre o parâmetro de interesseq. O modelo probabilístico de q, definido antes(depois) da realização do experimento X, é denominado a priori (a posteriori) de q.
Associação Muitas vezes o cientista enfrenta um dilema: O que observar para diminuir a incerteza sobre q ? Ele pode estar em presença de um conjunto de experimentos, digamos X,Y,Z,..., passíveis de serem observados. Pode haver custos ou restrições associados à realização dos experimentos. Assim, o estatístico é obrigado a selecionar quais serão observados.
Associação Para uma escolha adequada, ele deve descrever o tipo de associação que, em sua opinião, existe entre q e cada um dos experimentos. Essa descrição também é feita por meio de modelos probabilísticos. Por exemplo, considere que o experimento X vai ser realizado.
Associação Para cada valor, q, do parâmetro, represente por f(x|q) a função de probabilidade que avalia, para cada x, a probabilidade de {X=x}. Se existem pelo menos dois valores de q, digamos q1e q2, tal que f(.|q1) ¹ f(.|q2), então qe X são dependentes ou associados. Neste caso é razoável realizar-se o experimento X com o intuito de diminuir a incerteza sobre q. Q & X : conjuntos de valores possíveis de q e X, os conhecidos espaçosparamétricoeamostral.
Instrumental Dist. a priori:{P(q): qÎQ} Modelo Estatístico:{P(q,x): xÎX, qÎQ}. Dist. Amostral: Áq ={f(x|q): xÎX} "qÎQ. Verossimilhança: Áx = {L(q|x)=f(x|q): qÎQ} "xÎX. Dist a posteriori: {P(q|X=x): qÎQ} "xÎX.
Exemplo 1: BioEquivalência Uma nova droga para enxaqueca tenta entrar no mercado. O laboratório afirma que é equivalente a melhor droga da praça, cujo efeito positivo é de 75%. Além disso a nova droga sairá mais barato para o consumidor. Em média 60% mais barato! Uma pesquisa com 30 pacientes foi realizada e apenas 9 desses não responderam positivamente a nova droga.
Análise Padrão .311
Bayesian .292
Planejamento de Experimentos Quais quantidades devem ser observadas? As que podem gerar maior ganho de informação! Decisão antes de realizar e observar. Escolha é feita com base nas expectativas sobre resultados dos experimentos concorrentes. Essa análise de expectativas, é identificada como o clássico Planejamento de Experimentos. Procuram-se os planejamentos“ótimos”. Podem ser não realizáveis devido as restrições operacionais ou de custos.
Estimação: Formulação Obter a posteriori é o nosso objetivo maior Após coletar as informações disponíveis em x sobre q, o estatístico descreve a informação calibrada sobre q, a posteriori. Como então melhor predizerq ? A resposta é estudada com o nome de teoria da estimação. Mais geralmente pela teoria da decisão. De posse da posteriori,fx(q), decidimos então como melhor predizerq.
Estimação: Solução Consideramos características de fx(q) tais como média, mediana ou moda, dependendo da logística usada. Esse é o trabalho de estimação pontual. Por estimação intervalar entendemos a procura, do menor conjunto que, com probabilidade fixada (95%), contenha q: Conjunto de Credibilidade.
Teste de Significancia: Formulação Por teste de significância entendemos uma avaliação da consistência de uma hipótese H , sobre q,com o os dados, x. Entendemos que todo procedimento estatístico deve basear-se tão somente na posteriorifx(q). Por hipótese entendemos uma afirmação do tipo “o parâmetro qpertence ao subconjunto Q0Ì Q”.
Teste de Significancia: Solução Hipótese (não) precisa dim (Q0 )(=) <dim (Q). No casonão preciso,o valor dePx(Q0)é um bom avaliadorda consistência entreH&x. Nosso foco limita-se ao caso dim (Q0 )<dim (Q) das hipóteses precisas. Introduzimos o conceito de evidência contra ou a favor da hipótese H avaliada.
Full Bayesian Significance Test:FBST Evidência contra a hipótese: 1-ev = Pr(Tx),ondeTxÌ Qé tal que, t ÎTxeqÎQ0Þfx(t) > fx(q) . Tx é atangente (relativa a x)de Q0. evalto devemos aceitar H: q ÎQ0. Caso contrário, rejeitar H!
Regras L1-Convexidade: 0<P(A|H)<1 e P(H|H)=1. L2-Adição: P(A ou B|H) = P(A|H)+P(B|H) se A e B são exclusivos. L3-Multiplicação: P(A e B|H) = P(A|H)P(B|A e H). Uma extensão da lei número 2 é apresentada a seguir. Entretanto não é conseqüência de conceitos simples Note que nenhuma das 3 leis pode ser deduzida das outras. • L2’. Adição enumerável: Seja {(A1,...,An,...)} um conjunto enumerável de eventos mutuamente exclusivos. Então, • P(ÈAi|H)=SP(Ai|H)
Bibliography • -David Blackwell (1969), Basic Statistics, McGraw-Hill. • (Theory of Games & Statisticcal Decisions) • Morris DeGroot (1986), Probability & Statistics, Adison-Wesley • (Decision Theory) • -Bruno De Finetti (1972), Probability, induction, and statistics, Wiley. • (Theory of Probability, 2 volumes) • - Oscar Kempthorne & L Folks (1971), Probability, Statistics & • Data Analysis, Iowa University Press. • Dev Basu (1988), Statistical Information & Likelihood: A Collection • Of Critical Essays, JK Gosh editor, Springer-Verlag. • Lecture Notes in Statistics #45 • IJ Good (1983), Good Thinking, U. Minnesota Press. • Richard Barlow (1998), Engineering Reliability, SIAM • Paulino, Turkman & Murtrera (2003), Estatística Bayesiana. • Fundação Calouste Gulberkian - Lisboa