A direção p: um equivalente bayesiano do valor p?

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br


[Esteartigofoipublicadopelaprimeiravezem[Thisarticlewasfirstpublishedon R em easystats, e gentilmente contribuiu para os R-blogueiros]. (Você pode relatar um problema sobre o conteúdo desta página aqui)


Deseja compartilhar seu conteúdo com R-blogueiros? clique aqui se você tiver um blog ou aqui se não tiver.

A estrutura bayesiana é poderosa e permite uma incrível flexibilidade e controle sobre sua análise. Dito isto, os recém-chegados frequentemente enfrentam muitos novos conceitos e ferramentas e podem se beneficiar de alguns aterramento familiar. E a p-value é um índice muito familiar (embora paradoxalmente muitas vezes incompreendido, mas esse é outro tópico).

Existe um equivalente do p-valor? Bem, depende do que “equivalente” significa. Alguns podem argumentar que o Fator de Bayes é algum tipo de equivalente, ou seja, um valor que pode ser usado para decisões e interpretação de resultados. Alguns outros sugerem que o sistema baseado em MAP p-value é outra alternativa.

Com base em um estudo de simulação (Makowski et al., 2019), acreditamos que o probabilidade de direção (p-direction, ou pd) é o mais próximo estatístico equivalente ao p-valor. o estatístico é importante aqui, simplesmente significando que os dois índices estão fortemente correlacionados. Dito isto, eles são não conceitualmente equivalente (como argumentamos no artigo, o pd é um índice de efeito existência, ao invés de significado)

Aqui está um pequeno exemplo.

Regressão freqüentista

Primeiro, você pode instalar (ou atualizar) os pacotes necessários executando o seguinte (é importante que o discernimento a versão do pacote deve ser> = 0.8.1):

install.packages(c("insight", "bayestestR", "parameters"))

Vamos começar executando uma regressão linear simples e exibindo seu resultado com o parâmetros pacote.

library(parameters)

model 
## Parameter   | Coefficient |    SE |          95% CI |    t | df |     p
## -----------------------------------------------------------------------
## (Intercept) |      145.48 | 41.58 | [60.56, 230.40] | 3.50 | 30 | 0.001
## carb        |       30.31 | 12.87 | [ 4.02,  56.59] | 2.35 | 30 | 0.025

o p-valor da relação linear entre as duas variáveis ​​é de .025 (a segunda linha no p coluna). O que uma análise bayesiana nos diz?

Leia Também  Uma revisão da minha experiência com o curso Big Data Analysis with Scala and Spark

Regressão bayesiana (com priores planos)

Como você deve saber, uma análise bayesiana se aproxima de uma análise de máxima verossimilhança (o paradigma freqüentista típico) quando nenhuma informação é fornecida pelo anterior (e o resultado é conduzido apenas pelos dados). É o caso de priores planos, que dão uma probabilidade equivalente a todos e cada um dos seus sonhos mais loucos (consulte o Como especificar prioridades simples (e por que você normalmente não deveria) seção).

Vamos ajustar a mesma regressão acima em uma estrutura bayesiana com um plano anterior (ou seja, definindo-os como NULL)

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br
library(bayestestR)
library(rstanarm)

model 
parameters(model)
## Parameter   | Median |          89% CI |     pd | % in ROPE |  Rhat |   ESS |                Prior
## --------------------------------------------------------------------------------------------------
## (Intercept) | 145.97 | [78.68, 212.98] | 99.92% |     0.11% | 1.000 | 55624 |       Uniform ( +- )
## carb        |  30.24 | [ 9.47,  51.26] | 98.80% |     8.50% | 1.000 | 52688 | Normal (0 +- 191.83)

Diz-nos que o p-direção é de 98,80%, ou seja, 0.9880 (observe que seus resultados podem variar um pouco devido à natureza aleatória da amostra; você pode aumentar o número de iterações para obter resultados mais estáveis). Podemos visualizar rapidamente seu significado da seguinte maneira (com o Vejo pacote):

library(see)

plot(p_direction(model))

A partir de p-direção para p-valor

Podemos converter esse valor em um p-value usando a seguinte função:

pd_to_p(0.9880)
## [1] 0.024

Como podemos ver, não estamos longe do freqüentador p-valor!

Mas, novamente, precisamos sublinhar que o p-direction tem um significado e interpretação diferentes. Refere-se ao probabilidade de o efeito ser positivo ou negativo (dependendo do sinal da mediana). Mas como o p-value, ele não pode ser usado para apoiar uma falta de efeito (para isso, os índices baseados no ROPE ou os fatores Bayes podem ser mais apropriados).

Leia Também  Detectando vulnerabilidades de segurança em pacotes R

Além disso, ao usar Priores informativos centralizada em 0, uma análise bayesiana sempre levará a efeitos “menos significativos”, pois o anterior puxará o posterior em direção a 0. Essa é uma maneira natural de penalizar os resultados, o que é uma coisa boa.

Em conclusão, certifique-se de entender os índices que você usa (por exemplo, check-out nossa introdução suave à análise bayesiana)!

Envolver-se

easystats é um novo projeto em desenvolvimento ativo, buscando colaboradores e apoiadores. Portanto, não hesite em nos contatar se você quer se envolver 🙂

  • Confira nossos outros posts aqui!

Fique ligado

Para ser atualizado sobre o próximos recursos e coisas legais de ciência de dados ou R, você pode siga os pacotes no GitHub (clique em um dos pacotes easystats) e depois no Assistir botão no canto superior direito), bem como o equipe easystats no twitter e on-line:



Se você chegou até aqui, por que não inscreva-se para atualizações do site? Escolha seu sabor: e-mail, Twitter, RSS ou facebook …



cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br