A análise de dados estatísticos em psicologia deve ser como defecar?

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br

[ad_1]

Houve um tópico interessante no Twitter sobre modelos lineares mistos (LMMs) que alguém me informou recentemente. (Eu parei de seguir o Twitter por causa de sua inanidade geral, mas vale a pena comentar este tópico.) A essência das reclamações (tentar recriar essa lista de memória) era. Minha lista é um amálgama de comentários de pessoas diferentes; Acho que o tópico começou aqui:

Para resumir as reclamações:

– LMMs demoram muito para caber (cf. ANOVA de medidas repetidas). Isso diminui a produção do aluno.

– Muito tempo é gasto pensando sobre qual é a análise certa.

– A interpretação dos LMMs pode mudar drasticamente dependendo do modelo em que você se ajusta.

– Os revisores sempre se oporão a qualquer análise que fizerem e exigirão uma diferente. Muitas vezes, a análise que se faz não importa no que diz respeito à interpretação.

– O pacote lme4 exibe todos os tipos de comportamento estranho e instável. Devemos confiar em sua saída?

– O foco mudou de questões teóricas substantivas em psicologia * para métodos estatísticos, mas pessoas psicológicas * não podem ser estatísticas e nunca podem saber o suficiente. Isso levou ao comentário pitoresco de que fazer estatísticas deveria ser como cagar – não deveria se tornar o centro de toda a sua existência.

Na verdade, um psicólogo matemático que conheço, alguém que sabe o que está fazendo, certa vez me disse que, se você não consegue responder à sua pergunta com um teste t pareado, está fazendo a pergunta errada. Na verdade, se eu voltar aos meus conjuntos de dados existentes que publiquei entre 2002 e 2020, quase todos eles podem ser razoavelmente analisados ​​usando uma série de testes t pareados.

Leia Também  O que estudar se você estiver em quarentena

Há um pressuposto que está por trás das reclamações acima: o objetivo da análise de dados é descobrir se um efeito é significativo ou não. Uma vez que se compreende que esse não é o objetivo principal de uma análise estatística, as coisas começam a fazer mais sentido. O problema é que é muito difícil compreender esse ponto; isso ocorre porque a ideia de teste de significância de hipótese nula está profundamente arraigada em nossas mentes. Afastar-se disso parece impossível.

Aqui estão algumas reflexões sobre as objeções acima.

1 Se você deseja a simplicidade de testes t pareados e ANOVA de medidas repetidas, vá em frente. Mas libere seus dados e código e esteja aberto para que outras pessoas analisem seus dados de maneira diferente. Acho que é perfeitamente normal passar a vida inteira fazendo apenas testes t emparelhados e publicando os valores t e p resultantes. Claro, você ainda está ajustando modelos lineares mistos, mas bastante simplificados. Às vezes, não importa se você ajusta um modelo complicado ou simples, mas às vezes sim. Aconteceu comigo que um teste t pareado era exatamente a coisa errada a se fazer, e passei muito tempo tentando modelar os dados de forma diferente. Devemos nos preocupar com esses casos extremos? Acho que é uma decisão subjetiva que cada um de nós deve tomar individualmente. Aqui está outro exemplo de um estudo simples de duas condições, em que um modelo complicado que demorou uma eternidade para se ajustar deu uma nova visão do processo subjacente que gera os dados. O problema aqui se resume ao objetivo de uma análise estatística. Se aceitarmos a premissa de que a significância estatística é a objetivo, então devemos ir em frente e fazer o teste t pareado. Se, em vez disso, o objetivo for modelar o processo gerador, você começará a perder tempo. A posição que você toma realmente depende do que você deseja alcançar.

Leia Também  P é para porcentagem | R-bloggers
cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br

2 Não existe uma análise correta, e os revisores sempre farão objeções a qualquer análise que você apresentar. A razão pela qual os revisores propõem análises alternativas não tem nada a ver com a flexibilidade inerente dos métodos estatísticos. Tem a ver com acadêmicos serem contrários. Percebo isso em meu próprio comportamento: se meu aluno faz X, quero que ele faça Y! = X. Se eles fizerem Y, quero que façam X! = Y. Suspeito que os acadêmicos são um grupo autosselecionado, e uma coisa em que são bons é se opor a tudo o que outra pessoa diga ou faça. Portanto, o fato de os revisores continuarem pedindo análises diferentes é apenas o preço que se tem que pagar por lidar com acadêmicos, não é um problema inerente às estatísticas em si. Observe que os revisores também se opõem à lógica de um artigo e à redação. Estamos tão acostumados a lidar com essas coisas que não percebemos que é o mesmo tipo de reação que vemos nas análises estatísticas.

3 – Se você deseja velocidade e ainda deseja ajustar modelos lineares mistos, use as ferramentas certas. Existem muitas maneiras de ajustar rapidamente modelos lineares mistos. rstanarm, LMMs em Julia, etc. Por exemplo, Doug Bates, Philip Alday e Reinhold Kliegl ministraram um curso de uma semana sobre adaptação de LMMs super rápido em Julia: veja aqui.

4 – A interpretação de modelos lineares mistos depende da especificação do modelo. Isso surpreende muita gente, mas a surpresa se deve ao fato de que as pessoas têm uma compreensão muito incompleta do que estão fazendo. Se você não se dá ao trabalho de estudar a teoria da modelagem linear mista (compreensível, a vida é curta), opte por testes t pareados.

5 O comportamento instável e estranho do lme4 é problemático, mas isso não é razão suficiente para abandonar os modelos lineares mistos. A estranheza das mensagens e as inconsistências do lme4 são realmente frustrantes, é preciso admitir. Talvez seja este o preço que se tem de pagar pelo software livre (embora, tendo usado softwares não-livres como Word, SPSS, Excel, não tenho certeza se há alguma vantagem). Mas o fato é que os LMMs dão a você o poder de incorporar componentes de variância de uma forma sensata, e o lme4 faz o trabalho, se você sabe o que está fazendo. Como qualquer outro instrumento que alguém pensa em usar como profissional, se você não se dá ao trabalho de aprender a usá-lo, use algum método mais simples que você saiba usar. Por exemplo, não consigo usar fMRI; Não tenho acesso ao equipamento. Sou forçado a trabalhar com métodos mais simples e tenho que conviver com isso. Se você quiser mais controle sobre seus modelos hierárquicos do que o Ime4 oferece, aprenda Stan. Por exemplo, veja nosso capítulo sobre modelos hierárquicos aqui.

Leia Também  Validação cruzada de modelo linear, xgboost e randomForest usando crossval :: crossval_ml

Pessoalmente, acho que é possível aprender estatística suficiente para usar modelos lineares mistos com competência; não é preciso se tornar um estatístico. O currículo que acho que é necessário em psicologia e áreas afins está resumido em nossa escola de verão sobre métodos estatísticos, que ministramos anualmente em Potsdam. É um compromisso de tempo, mas vale a pena. Já vi muitas pessoas passarem do conhecimento zero a modelos hierárquicos sofisticados, então sei que as pessoas podem aprender tudo isso sem que isso tome conta de suas vidas.

Provavelmente, o maior problema por trás de todas essas reclamações é o mal-entendido em torno do teste de significância da hipótese nula. Infelizmente, os valores-p raramente lhe dirão algo útil, significativo ou não, a menos que você esteja disposto a investir muito tempo e esforço (exatamente o que as pessoas querem evitar). Portanto, realmente não vai importar muito se você os calcula usando testes t pareados ou modelos lineares mistos.



[ad_2]

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br