Probabilidade e modelagem bayesiana [book review]

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br


[Esteartigofoipublicadopelaprimeiravezem[Thisarticlewasfirstpublishedon R – Og de Xian, e gentilmente contribuiu para os R-blogueiros]. (Você pode relatar um problema sobre o conteúdo desta página aqui)


Deseja compartilhar seu conteúdo com R-blogueiros? clique aqui se você tiver um blog ou aqui se não tiver.

A modelagem probabilística e bayesiana é um livro de Jim Albert e Jingchen Hu que a CRC Press me enviou para revisão no CHANCE. (O livro também está disponível gratuitamente em formato de livro.) O nível do livro didático é definitivamente mais introdutório, pois dedica sua primeira metade aos conceitos de probabilidade (sem a teoria da medida envolvida), significando principalmente o enfoque na contagem e modelos de espaço de amostra finito. A segunda metade passa para a inferência bayesiana, com forte dependência do JAGS para o processamento de modelos mais realistas. E vinhetas R para os casos mais simples (onde descobri os comandos R que ignorei, como dplyr :: mutate ()!).

Como aviso preliminar sobre meus preconceitos, estou sempre reservado a misturar introduções à teoria das probabilidades e às estatísticas (bayesianas) no mesmo livro, pois acho que elas devem ser separadas para evitar confusão. Por exemplo, entre histogramas e densidades, ou entre expectativa (teórica) e média (empírica). Portanto, não relaciono o ritmo e o tom adotados no livro que, na minha opinião, parecem se basear em exemplos excessivamente simples. [far too often concerned with food or baseball] ao pular os conceitos e a teoria dos antecedentes. Por exemplo, a introdução do conceito de probabilidade subjetiva desde a página 6 é louvável, mas duvido que envolva novos leitores ao descrevê-lo como uma medida da “crença sobre a verdade de um evento”, e depois enfatizando que “faz qualquer tipo de medição, é preciso uma ferramenta como uma balança ou régua ”. No geral, não tenho críticas particularmente focadas na parte de probabilidade, exceto pelo desequilíbrio discreto versus contínuo. (Com a distribuição de Poisson não abordada no capítulo Distribuições discretas. E a “curva de sino” fazendo uma aparência estranha e sem rigor lá). O quadro de Galton (nenhuma menção encontrada ao quincunce) poderia ter sido mais bem explorado na definição física de um prior, seguindo a análise de Steve Stiegler, adicionando um segundo nível. Ou se transformou em um exercício de codificação R. No capítulo de distribuições contínuas, eu teria visto o cdf chegando primeiro ao pdf, e não o contrário. E não gostava da noção de que uma distribuição Normal era suportada por um histograma de tempos de corrida (maratona), ou seja, valores mais baixos delimitados por 122 (no momento). Ou mais tarde (no capítulo 8), para os tempos de serviço de Roger Federer. Aliás, um erro de digitação divertido na p.191, pelo menos divertido para os usuários do LaTeX, como

Leia Também  Plataformas de mineração Zigmabit oferecem o ROI mais rápido do mercado

f_ {Y meio X}

com um espaço extra entre “” e “mid”! (Também notei várias ocorrências do erro de digitação inviável nos últimos capítulos.) A simulação de uma distribuição normal bivariada oculta por trás de uma função R personalizada sim_binom () quando ela poderia ser facilmente descrita como uma hierarquia de dois estágios. E nenhum comentário sobre o fato de que uma amostra do Y-1.5X poderia ser diretamente derivada da amostra conjunta. (Um estatístico inconsciente demais ?!)

Ao passar para a inferência bayesiana, uma grande seção é gasta em modelos muito simples, como estimar uma proporção ou uma média, cobrindo tanto os anteriores discretos quanto os contínuos. E enfatizando fortemente os priores conjugados, apesar de avisar que eles não refletem necessariamente informações ou crenças anteriores. Com alguma recomendação discutível para variações anteriores “grandes” como pouco informativas ou (pior) para Exp (1) como uma referência anterior para a precisão da amostra no modelo linear (p.415). Mas também cobrindo a verificação do modelo bayesiano via preditivo prévio (portanto, fatores de Bayes) ou preditivo posterior (sem mencionar o uso dos dados duas vezes). Uma margem muito importante na introdução de uma estatística suficiente para o modelo Normal. Na seção Verificação do modelo normal, uma estimativa da densidade posterior da média é usada sem explicação (aparente).

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br

“É interessante notar a forte correlação negativa nesses parâmetros. Se alguém atribuiu antecedentes independentes informativos em e , essas crenças anteriores seriam contrárias à correlação entre os dois parâmetros observados nos dados “.

Pelas mesmas razões de ter que recorrer à validação e rigor matemáticos, o Capítulo 9 no MCMC não está explicando por que os algoritmos do MCMC estão convergindo para fora do caso do espaço de estados finito. A proposta na representação algorítmica é escolhida como Uniforme, pois problemas de dimensão maior são tratados por Gibbs ou JAGS. As recomendações sobre a execução do MCMC não incluem quantas iterações devem ser executadas (ou outras consultas comuns no Stack eXchange), embora elas incluam a execução sensata de várias cadeias e a comparação de amostras preditivas simuladas com os dados reais como uma verificação de modelo. No entanto, o capítulo MCMC rapidamente e inevitavelmente se transforma em código JAGS comentado. Presumo que isso exigiria mais dos alunos do que apenas ler o código disponível. Como o manual JAGS. O capítulo 10 é principalmente uma série de exemplos de modelagem hierárquica bayesiana, com ilustrações do efeito de encolhimento como o da capa do livro. O capítulo 11 cobre a regressão linear simples com algumas menções a priors fracamente informativos, embora com o espírito do BUGS de usar grandes [enough?!] variações: “Se houver pouca informação sobre a localização de um parâmetro de regressão, então a escolha do palpite anterior não é tão importante e escolhe-se um grande valor para o desvio padrão anterior . Portanto, a interceptação e a inclinação da regressão recebem um Normal anterior com uma média de 0 e desvio padrão igual ao grande valor de 100. ” (p.415). Independentemente da escala de y? A padronização é abordada mais adiante neste capítulo (com o uso da escala de funções R ()) como parte da construção de priors mais informativos, embora isso pareça mais com os anteriores dependentes de dados, no sentido de que a escala e a localização são sumariamente estimadas por meios empíricos dos dados. A citação acima também me parece potencialmente confusa para os alunos, pois não explica de maneira alguma como projetar uma distribuição conjunta nos coeficientes de regressão linear que traduzem a concentração desses coeficientes ao longo de y̅ = β⁰ + β¹x̄. O capítulo 12 expande a configuração para regressão múltipla e modelos lineares generalizados, consistindo principalmente de exemplos. No entanto, sugere o uso de validação cruzada para verificação do modelo e, em seguida, defende o DIC (critério de informações de desvio) como “para aproximar o desempenho preditivo fora da amostra de um modelo” (p.463). Se apenas por estar coberto no JAGS, a definição do critério será relegada para a última página do livro. O capítulo 13 conclui com dois estudos de caso, a análise (freqüentemente usada) de Federalist Papers e um modelo hierárquico de carreira no beisebol. O que pode parecer abrangente, considerando os pré-requisitos modestos com os quais o livro começou.

Leia Também  A geometria da riqueza: como moldar uma vida de dinheiro e significado

Em conclusão desta divagação [lazy Sunday] Em resumo, este não é um livro que eu teria a oportunidade de usar em Paris-Dauphine, mas posso conceber facilmente sua adoção para estudantes com exposição limitada à matemática. Como tal, oferece uma entrada decente no uso da modelagem bayesiana, suportada por um software específico (JAGS), e enfatiza corretamente a chamada à verificação e comparação de modelos com pseudo-observações. Desde que o curso seja reforçado com uma quantidade razoável de laboratórios e projetos de informática, o livro pode realmente ser feito para apresentar adequadamente aos alunos o pensamento bayesiano. Esperançosamente, levando-os a procurar cursos mais avançados sobre o assunto.



Se você chegou até aqui, por que não inscreva-se para atualizações do site? Escolha seu sabor: e-mail, Twitter, RSS ou facebook …



cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br