Preconceito de colisor, ou: as gostosas são escuras e se beijam feio?

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br


A correlação e seus desafios associados não perdem o fascínio: a maioria das pessoas sabe que correlação não implica causalidade, poucas pessoas sabem que o oposto também é verdadeiro (veja: Causação também não implica correlação) e algumas sabem que a correlação pode ser apenas aleatória (os chamados correlação espúria)

Se você deseja aprender sobre um efeito paradoxal de que quase ninguém sabe, onde a correlação entre duas variáveis ​​aleatórias não correlacionadas é introduzida apenas por amostragem, continue lendo!

Vamos apenas entrar em um exemplo (inspirado em Quando a correlação não é causal, mas algo muito mais arrogante): para todos os efeitos, vamos assumir que a aparência e o QI são normalmente distribuídos e não correlacionados:

set.seed(1147)
hotness 

Now, we can ask ourselves: why does somebody become famous? One plausible assumption (besides luck, see also: The Rich didn’t earn their Wealth, they just got Lucky) would be that this person has some combination of attributes. To stick with our example, let us assume some combination of hotness and intelligence and let us sample some “celebrities” on the basis of this combination:

pop$comb  235, ] # sample celebs on the basis of this combination
plot(celebs$hotness ~ celebs$IQ, xlab = "IQ", ylab = "hotness",  main = "Celebrities")
abline(lm(celebs$hotness ~ celebs$IQ), col = "red")

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br

Uau, uma clara relação negativa entre gostosura e QI! Mesmo altamente significativo (para entender o significado, veja também: De lançamentos de moedas a p-Hacking: torne as estatísticas significativas novamente!):

cor.test(celebs$hotness, celebs$IQ) # highly significant
## 
##  Pearson's product-moment correlation
## 
## data:  celebs$hotness and celebs$IQ
## t = -14.161, df = 46, p-value 

How can this be? Well, the basis (the combination of hotness and IQ) on which we sample from our (uncorrelated) population is what is called a collider (variable) in statistics. Whereas a confounder (variable) influences (at least) two variables (A ← C → B), a collider is the opposite: it is influenced by (at least) two variables (A → C ← B).

In our simple case, it is the sum of our two independent variables. The result is a spurious correlation introduced by a special form of selection bias, namely endogenous selection bias. The same effect also goes under the name Berkson’s paradox, Berkson’s fallacy, selection-distortion effect, conditioning on a collider (variable), collider stratification bias, or just collider bias.

To understand this effect intuitively we are going to combine the two plots from above:

plot(hotness ~ IQ, main = "The general population & Celebrities")
points(celebs$hotness ~ celebs$IQ, col = "red")
abline(a = 235, b = -1, col = "blue")

Na realidade, as coisas muitas vezes não são tão simples. Ao pesquisar no Google os termos de pesquisa acima, você encontrará todos os tipos de exemplos, por exemplo o assim chamado paradoxo da obesidade (um aparente efeito preventivo da obesidade sobre a mortalidade em indivíduos com doença cardiovascular (DCV)), um suposto efeito protetor do neuroticismo para a saúde ou previsões tendenciosas de aprendizado profundo do câncer de pulmão.

Como exemplo: se um resultado estatístico implica um relacionamento que parece estranho demais para ser verdade, é possível! Para verificar se o viés do colisor pode estar presente, verifique se a amostragem estava sendo realizada com base em uma variável que é influenciada pelas variáveis ​​que parecem estar correlacionadas! Caso contrário, você pode não apenas concluir falsamente que pessoas bonitas geralmente são pessoas estúpidas e inteligentes feias…



Se você chegou até aqui, por que não inscreva-se para atualizações do site? Escolha seu sabor: e-mail, Twitter, RSS ou facebook ...



cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br
Leia Também  Orçamento da União e seu plano financeiro?