Covid-19: Explore seus graus de liberdade do visualizador

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br


Preparando o palco

Todo mundo parece estar estrelando tramas que descrevem a propagação da pandemia nos dias de hoje. Uma coisa que chamou minha atenção é como pequenas diferenças relativas nas opções de design podem influenciar a mensagem que um visual exibe. Usando os gráficos do “Financial Times Plots” desenvolvidos por John Burn-Murdoch como exemplo, exploro os graus de liberdade do visualizador.

Eu uso meu pacote {tidycovid19} para extrair e plotar os dados.

# remotes::install_github("joachim-gassen/tidycovid19")
suppressPackageStartupMessages({
  library(tidyverse)
  library(tidycovid19)
})

covid19_dta 

o plot_covid19_spread() A função permite personalizar o gráfico em várias dimensões. Por padrão, ele plota, usando dados da equipe CSSE da Universidade Johns Hopkins, o desenvolvimento cumulativo de mortes relatadas por país por ‘hora do evento’, começando com o dia da centésima morte, usando uma escala de log para o eixo y.

Os fatores que você pode personalizar são

  • os dados que você deseja plotar (mortes, casos confirmados, casos recuperados ou “casos ativos”, significando a diferença de casos confirmados e recuperados),
  • o ponto inicial do eixo X
  • quantos dias você deseja traçar,
  • quantos dias de dados os países precisam ser incluídos,
  • se você deseja usar um log ou uma escala linear para o eixo Y,
  • se você deseja que os dados sejam dimensionados por população ou não,
  • se você deseja examinar casos cumulativos ou alterações diárias de casos,
  • se você quiser analisar as alterações diárias, o período durante o qual calcular essas alterações em média,
  • intervenções governamentais que você deseja destacar no gráfico e
  • países que você deseja destacar

Assumindo três variantes sensíveis diferentes para as escolhas numéricas e deixando de fora a opção de destaque, essas opções geram 2.592 graus de liberdade. Muitos gráficos para escolher aquele que comunica os dados de maneira mais justa. A seguir, interpreto o advogado do diabo. Tento produzir um gráfico em que a situação parece muito ruim e um gráfico em que as coisas parecem tão brilhantes quanto possível. Ao fazê-lo, concentro-me nos grandes países europeus e nos EUA.

Leia Também  Organização dos novos conjuntos de dados da série temporal Johns Hopkins Covid-19

Se você quiser ver se pode fazer melhor (tenho certeza de que pode), use o aplicativo brilhante incluído no pacote. Ele permite que você personalize todos os parâmetros em tempo real e copie o código para plotar o gráfico resultante na área de transferência.

A visão negativa

Vamos nos concentrar principalmente nas mortes, uma vez que estas têm menos probabilidade de serem influenciadas pela variação nos protocolos de teste entre os países. Para impor uma visão negativa, usamos uma escala linear, pois esta comunica claramente o componente de crescimento exponencial. Uma primeira tentativa:

plot_covid19_spread(
  covid19_dta, type = "deaths", min_cases = 100, min_by_ctry_obs = 7,
  edate_cutoff = 35, per_capita = FALSE, log_scale = FALSE,
  cumulative = TRUE, change_ave = 7,
  highlight = c("FRA", "DEU", "ITA", "ESP", "GBR", "USA"),
  intervention = NULL
)

Agora, parece que todos os países estão aproximadamente na mesma trajetória. Vamos supor que queremos destacar os EUA

plot_covid19_spread(
  covid19_dta, type = "deaths", min_cases = 500, min_by_ctry_obs = 7,
  edate_cutoff = 20, per_capita = FALSE, log_scale = FALSE,
  cumulative = TRUE, change_ave = 7,
  highlight = c("FRA", "DEU", "ITA", "ESP", "GBR", "USA"),
  intervention = NULL
)

Ao mover o ponto inicial do eixo X, concentramos a atenção dos espectadores no período em que as mortes estavam crescendo mais rapidamente nos EUA em comparação com outras regiões do mundo. Também podemos fazer a Espanha parecer ruim?

plot_covid19_spread(
  covid19_dta, type = "deaths", min_cases = 1, min_by_ctry_obs = 7,
  edate_cutoff = 30, per_capita = FALSE, log_scale = FALSE,
  cumulative = TRUE, change_ave = 7,
  highlight = c("FRA", "DEU", "ITA", "ESP", "GBR", "USA"),
  intervention = NULL
)

Agora isso parece horrível para a Espanha. BTW: Eu usei um truque barato nos dois últimos gráficos. Adivinha o quê: cortei o eixo X. Veja por si mesmo:

plot_covid19_spread(
  covid19_dta, type = "deaths", min_cases = 1, min_by_ctry_obs = 7,
  edate_cutoff = 55, per_capita = FALSE, log_scale = FALSE,
  cumulative = TRUE, change_ave = 7,
  highlight = c("FRA", "DEU", "ITA", "ESP", "GBR", "USA"),
  intervention = NULL
)

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br

Veja, ao mudar o eixo X, você pode se concentrar mais ou menos em certas regiões das curvas em que um determinado país teve, relativamente falando, a taxa de crescimento mais rápida.

Leia Também  Faça Andrew feliz com um simples truque do ggplot

O próximo gráfico é extremamente injusto, pois também estou alterando os dados que apresento. Agora, concentro-me na mudança diária de casos ativos, significando a diferença de casos confirmados e recuperados.

plot_covid19_spread(
  covid19_dta, type = "active", min_cases = 1000, min_by_ctry_obs = 20,
  edate_cutoff = 40, per_capita = FALSE, log_scale = FALSE,
  cumulative = FALSE, change_ave = 7,
  highlight = c("FRA", "DEU", "ITA", "ESP", "GBR", "USA"),
  intervention = NULL
)

Ele comunica a impressão de que a situação nos EUA está diminuindo a situação na Europa, o que claramente não é o caso. Hora de se tornar menos pessimista e mudar o foco para o lado mais positivo das coisas.

A visão positiva

Para melhorar as coisas, vamos primeiro mudar para a escala de log para o eixo Y. Voltamos a nos concentrar nas mortes.

plot_covid19_spread(
  covid19_dta, type = "deaths", min_cases = 100, min_by_ctry_obs = 7,
  edate_cutoff = 40, per_capita = FALSE, log_scale = TRUE,
  cumulative = TRUE, change_ave = 7,
  highlight = c("FRA", "DEU", "ITA", "ESP", "GBR", "USA"),
  intervention = NULL
)

A escala de log nos permite ver as taxas de crescimento em declínio. Essa é uma boa notícia que é muito menos óbvia sem o eixo Y em escala de log. Podemos tornar essa mudança no crescimento mais pronunciada? Sim. Vamos analisar novos casos diários.

plot_covid19_spread(
  covid19_dta, type = "deaths", min_cases = 500, min_by_ctry_obs = 7,
  edate_cutoff = 40, per_capita = FALSE, log_scale = TRUE,
  cumulative = FALSE, change_ave = 1,
  highlight = c("FRA", "DEU", "ITA", "ESP", "GBR", "USA"),
  intervention = NULL
)

Uuh uuh. Isso parece confuso. As alterações diárias são barulhentas, também por motivos de coleta de dados. Vamos suavizar isso por sete dias.

plot_covid19_spread(
  covid19_dta, type = "deaths", min_cases = 500, min_by_ctry_obs = 7,
  edate_cutoff = 30, per_capita = FALSE, log_scale = TRUE,
  cumulative = FALSE, change_ave = 7,
  highlight = c("FRA", "DEU", "ITA", "ESP", "GBR", "USA"),
  intervention = NULL
)

Ah Isso parece melhor. Agora você pode ver que a Itália e a Espanha “achataram a curva”. É fácil entender esse gráfico de uma maneira que menos pessoas são afetadas pela pandemia. Este não é o caso. Ainda existem muitas pessoas morrendo e casos confirmados e ativos estão aumentando, mas há uma tendência na Itália e na Espanha de que menos pessoas morrem todos os dias. Isso certamente é uma boa notícia. Para os EUA, no entanto, infelizmente, as coisas ainda não parecem boas.

Leia Também  9 maneiras inteligentes de usar seu reembolso de imposto

Para o último gráfico, suponhamos que gostaríamos de enfatizar menos as diferenças entre países e mais a tendência geral.

plot_covid19_spread(
  covid19_dta, type = "deaths", min_cases = 100, min_by_ctry_obs = 7,
  edate_cutoff = 40, per_capita = FALSE, log_scale = TRUE,
  cumulative = FALSE, change_ave = 7,
  highlight = c("FRA", "DEU", "ITA", "ESP", "GBR", "USA"),
  intervention = NULL
)

Resumindo

Mesmo usando os mesmos dados, os gráficos podem se comunicar de maneira muito diferente. Receber uma mensagem “neutra” para o leitor está longe de ser trivial. Também é preciso levar em consideração o nível de experiência que um leitor possui, por exemplo, com diferentes escalas de eixo. Visualizações sem orientação podem ser particularmente enganosas. Visualizações interativas como a fornecida pelo aplicativo brilhante do pacote {tidycovid19} podem ser úteis para explorar os dados e seus graus de liberdade de visualização inerentes, mas provavelmente são mais adequados para um público experiente.

Todos: aproveite, fique bem e mantenha #FlattenTheCurve!



Se você chegou até aqui, por que não inscreva-se para atualizações do site? Escolha seu sabor: e-mail, Twitter, RSS ou facebook …



cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br