Dados da pesquisa do Facebook para o Covid-19 Symptom Data Challenge por @ ellis2013nz

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br


O Covid-19 Symptom Data Challenge (em andamento no momento em que escrevo esta postagem no blog) disponibiliza dois grandes conjuntos de dados de pesquisa. Eles são fornecidos na forma granular, mas agregada, ou seja, sem microdados de nível de resposta, pelo menos para este Desafio. As duas pesquisas cobrem os EUA e o resto do mundo, respectivamente, e envolvem centenas de milhares de usuários do Facebook com 18 anos ou mais, em 119 países. O verdadeiro desafio é usar esses dados para esta finalidade:

“Você pode desenvolver uma nova abordagem analítica que use os dados da Pesquisa de Sintomas CMU / UMD COVID-19 para permitir a detecção precoce e melhorar a consciência situacional do surto pelas autoridades de saúde pública e pelo público em geral?”

O Desafio é uma parceria organizada por [email protected] 2.0 com Facebook Data for Good, o Delphi Group da Carnegie Mellon University (CMU), o Joint Program on Survey Methodology na University of Maryland (UMD), o Duke Margolis Center for Health Policy e Resolve to Save Lives, uma iniciativa de Estratégias vitais. Não sou afiliado de forma alguma ao Desafio ou a qualquer um de seus parceiros.

As inscrições devem ser feitas em 6 de outubro de 2020. Gostaria de fazer uma inscrição, mas faltou tempo. Além disso, na minha primeira olhada nos dados, eu não tinha certeza de que poderia desenvolver uma nova abordagem analítica “para permitir a detecção precoce e uma melhor consciência situacional”; pelo menos não sem uma definição muito ampla de “consciência situacional aprimorada” que vai muito além do que está implícito nos exemplos de abordagens analíticas fornecidas. Vou usar este post para anotar algumas coisas que me ocorreram no tempo que eu tinha disponível para olhar esses dados.

Minha conclusão resumida é que essas duas enormes pesquisas com usuários do Facebook parecem fornecer novas informações valiosas sobre como o mundo está respondendo à Covid-19, mas não tenho certeza se elas têm potencial para permitir a detecção precoce de surtos. Portanto, analisarei com interesse o que as pessoas inventam para responder ao desafio.

Meu código para baixar, organizar e analisar esses dados está neste repositório GitHub.

Variação por tempo e estado na Austrália

Decepcionante para sintomas como um indicador de alerta precoce

Ao olhar para esses dados, comecei com o que eu conhecia melhor, a situação na Austrália. A pesquisa UMD tem tamanho de amostra suficiente para falar de forma significativa sobre as tendências ao longo do tempo por estados e territórios. Aqui está o que certamente é a estatística principal, a porcentagem da população com mais de 18 anos relatando “sintomas de doença semelhantes à Covid”:

Essas estimativas são as ponderadas fornecidas pelo Facebook, portanto, foram corrigidas para idade e sexo na amostra para permitir estimativas imparciais de valores populacionais. Existem perguntas individuais mais detalhadas disponíveis nos dados CSV (mas não na versão API dos dados), relacionadas a tosses, febres, etc., mas estas foram combinadas por especialistas relevantes em uma única proporção da população com o tipo Covid sintomas.

Sabendo o que está acontecendo na Austrália nos últimos seis meses, fiquei muito decepcionado com este resultado. Praticamente não houve casos de Covid na maior parte do país, enquanto em julho e agosto chegamos a 100 casos por milhão por dia em Victoria (população de 6,7 milhões). Isso significou que, por um curto período no final de julho, Victoria estava no pico de novos casos que o Reino Unido enfrentou seis semanas antes, comparável ao nível que os EUA como um todo experimentaram em setembro ou metade do pico dos EUA de 200 casos por milhões por dia durante julho. Então, por algumas semanas, Victoria realmente se sentiu parte da pandemia, enquanto no resto da Austrália ela foi efetivamente suprimida ou (por exemplo, na Austrália Ocidental) eliminada.

No entanto, não há nenhum sinal disso no gráfico de sintomas semelhantes a Covid relatados pela pesquisa. Não há como você julgar, olhando para o gráfico acima, que Victoria foi atingida por Covid mais do que os outros estados; ou que foi 10-100 vezes pior em julho e agosto em Victoria do que antes e depois.

Claro, este é apenas um país, um com taxas de Covid relativamente baixas, e pode haver muito mais para colher dos dados completos. Há um exemplo de aparência muito promissora com os dados da Flórida no site do Desafio que mostra uma relação muito mais forte entre os sintomas e os casos reais de Covid. E eu nem tentei nenhuma modelagem estatística com os dados australianos. Mas apenas observar os dados é suficiente para mostrar que não há um indicador espetacular, de alerta precoce e confiável aqui.

Leia Também  FX HedgePool entra em operação
cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br

Pode haver algum sinal através do ruído, mas eu ficaria muito nervoso sobre aconselhar governos sobre ações com base nisso. Você poderia alertar o governo da Austrália Ocidental sobre essa tendência de alta em agosto e setembro – isso significa um surto de Covid não detectado, em um período de complacência e aparente eliminação? Parece improvável (não impossível, é claro! – nesse caso, isso se tornaria retroativamente uma justificativa espetacular desse uso dos dados). Veremos o que acontecerá, tanto na Austrália Ocidental quanto na análise em resposta ao Desafio.

Mas a pesquisa certamente está refletindo a realidade em outras variáveis

Com novos dados de pesquisa, quando ficamos desapontados com uma variável importante, muitas vezes nos perguntamos “será que embaralhamos a coisa toda? Ou talvez as pessoas estejam inventando completamente suas respostas? ” Uma verificação de realidade essencial é olhar para outras variáveis ​​que podemos validar. Escolhi a porcentagem de australianos que não usam máscaras (escolhi ‘não’ por causa da forma como a pergunta original foi estruturada – opções para “nunca”, “Alguns”, “metade”, “a maioria” e “todo o tempo”). Desta vez, vemos um padrão impressionantemente rígido, na verdade o sinal mais claro que já vi nos dados da pesquisa:

Raramente vemos algo nos dados da pesquisa tão restrito quanto isso. Em ambas as comparações espaciais e temporais, o que vemos aqui é exatamente o que esperaríamos. Fiquei surpreso com o número de residentes de NSW e Queensland que usavam máscaras pelo menos às vezes, mas um pouco de pesquisa no Google me mostrou que eu deveria ter esperado isso. eu certamente não era surpreso que zero vitoriano relatou nunca ter usado uma máscara no último mês ou assim. Eles são obrigatórios ao sair de casa, e o cumprimento que vejo é muito alto. Acho que podemos ter certeza de que a pesquisa não foi embaralhada durante o processamento e que as pessoas realmente estão respondendo de forma significativa às perguntas que são feitas.

Leia Também  Webinar sobre mlr3pipelines | R-bloggers

A pesquisa nos diz alguma coisa sobre saúde

Então, o que acontece com algumas dessas outras variáveis? É aqui que eu acho que esses dados realmente acrescentam alguns insights valiosos. Por exemplo – há muito interesse no impacto do Covid-19 na saúde mental e nas respostas a ele. Esta é uma área onde os dados de pesquisas têm um longo histórico de uso em estimativas de prevalência. Existem algumas perguntas de alto nível na pesquisa que são interessantes, incluindo uma sobre a frequência com que o entrevistado se sente deprimido. Aqui estão os resultados por estado:

Isso parece algo significativo e (eu acho) novo. Em particular, essa tendência de queda em Victoria valida a experiência de muitas pessoas, tenho certeza, mas ainda não vi evidências específicas como essa.

As pesquisas são difíceis e caras, principalmente se você deseja executá-las dia após dia e obter tendências de tempo. Não conheço nenhuma outra fonte de dados que obtenha algo parecido com esse tipo de imagem, certamente não com essa frequência e oportunidade. Eu ficaria surpreso se não houvesse potencial para esses dados serem usados ​​para algum tipo de monitoramento significativo e consciência situacional aqui; portanto, mesmo que não seja ótimo para um aviso antecipado da Covid-19, ainda assim deverá ter algo a contribuir.

Seis países

Aqui estão três gráficos semelhantes aos acima, mas para seis países escolhidos arbitrariamente. Não tenho muito a dizer sobre isso; é semelhante à situação australiana, mas em letras grandes. Isso é:

  • não tenho certeza se o monitoramento dos sintomas nos diz muito em termos de aviso prévio, mas pode haver algo se investigarmos mais
  • as perguntas sobre máscaras certamente revelar padrões nacionais e temporais
  • a questão sobre depressão provavelmente nos diz algo útil, certamente em termos de tendências ao longo do tempo, possivelmente entre países.

Isso é tudo por hoje. Ótima fonte de dados; será um desafio usar para entender a incidência da Covid; pode ter mais a dizer sobre outras questões indiretas.

O código está no GitHub



cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br