[ad_1]
Quer compartilhar seu conteúdo em R-bloggers? clique aqui se você tiver um blog, ou aqui se não tiver.

eixo x: última média de 7 dias para novos casos diários confirmados em laboratório por 10.000 pessoas
eixo y: o aumento de 30 dias dos novos casos, medido pela razão logarítmica
Quanto mais perto do canto inferior esquerdo, melhor o bairro está.
Em seguida, criei uma métrica de distância entre o bairro e Greenwich como uma medida de gravidade:
Gravidade = média (classificação de percentil ao longo do eixo x, Classificação de percentil ao longo do eixo y)
que eu então configuro como uma variável dependente.
- Alguns sugerem que talvez haja agrupamentos relacionados ao festival Eid. No entanto, há na verdade um coeficiente negativo e insignificante quando faço a regressão em relação aos dados de etnia. (1)
- Talvez a riqueza possa ser um substituto para a mobilidade no exterior e empregos que não sejam de colarinho branco. Se eu usar o preço da casa (link no código) como um proxy para a riqueza, o resultado novamente é muito fraco.
- Nenhuma relação com a densidade populacional do bairro também.
Você consegue identificar algum padrão?
(1) https://data.london.gov.uk/dataset/detailed-ethnicity-by-age—sex-ward-tools—2011-census–
Código completo abaixo:
biblioteca (data.table)
biblioteca (ggplot2)
biblioteca (ggrepel)
data_url
dados não tratados
#Úteis para filtrar apenas conselhos de Londres e riqueza proxy
#https: //data.london.gov.uk/dataset/average-house-prices
house_prices_data
#https://data.london.gov.uk/dataset/land-area-and-population-density-ward-and-borough
. (população = média (população),
densidade = média (Population_per_square_kilometre)),
por = “Código”]
london_data
Area.type == “utla” ,,]
london_data[,Specimen.date := as.Date(Specimen.date)]
london_data
data.table (Specimen.date = seq (
min (london_data[,Specimen.date]),
max (london_data[,Specimen.date]),
por = “1 dia”
)), todos = TRUE, por = “Specimen.date”)
setkey (london_data, Specimen.date)
setnafill (london_data, type = “const”, fill = 0,
cols = c (“Daily.lab.confirmed.cases”))
london_data[,roll_mean := frollmean(Daily.lab.confirmed.cases, n = 7, align = “right”),
by = “Area.code”]
#Excluir os últimos 3 dias devido ao atraso
london_data_summary
. (conselho = Area.name[1],
latest_avg = roll_mean[.N],
rate_of_new_cases = log (roll_mean[.N]/ roll_mean[.N-30])),
por = “Area.code”]
geom_point (color = “# ff0000”) +
geom_text_repel () +
laboratórios (x = ”Última média de 7 dias por 10.000 ″, y =“ Taxa de aumento (razão de log) nos últimos 30 dias ”) +
theme_bw () +
ggtitle (“Londres: Média dos últimos 7 dias em novos casos e sua taxa de aumento pelos conselhos”)
#Teste estatístico #
london_data_summary[,severity := (daily_increase_ecdf(latest_avg/population) +
rate_of_increase_ecdf(rate_of_new_cases))/2]
resumo (lm (gravidade ~ população + densidade,
data = london_data_summary))
Relacionados
[ad_2]