O é para order_by | R-bloggers

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br


[Esteartigofoipublicadopelaprimeiravezem[Thisarticlewasfirstpublishedon Profundamente Trivial, e gentilmente contribuiu para os R-blogueiros]. (Você pode relatar um problema sobre o conteúdo desta página aqui)


Deseja compartilhar seu conteúdo com R-blogueiros? clique aqui se você tiver um blog ou aqui se não tiver.

Esta será uma publicação rápida em outra função ordenada, order_by. Eu admito, não uso este tão frequentemente quanto o combinado. No entanto, pode ser útil se você não deseja alterar permanentemente a ordem do seu conjunto de dados, mas deseja usar funções que exijam a solicitação dos dados. Um exemplo é a função de soma acumulada (cumsum).

## -- Attaching packages -------------------------------------------------------------------------------- tidyverse 1.3.0 --
##  ggplot2 3.2.1      purrr   0.3.3
## tibble 2.1.3 dplyr 0.8.3
## tidyr 1.0.0 stringr 1.4.0
## readr 1.3.1 forcats 0.4.0
## -- Conflicts ----------------------------------------------------------------------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
reads2019  read_csv("~/Downloads/Blogging A to Z/SaraReads2019_allrated.csv",
col_names = TRUE)
## Parsed with column specification:
## cols(
## Title = col_character(),
## Pages = col_double(),
## date_started = col_character(),
## date_read = col_character(),
## Book.ID = col_double(),
## Author = col_character(),
## AdditionalAuthors = col_character(),
## AverageRating = col_double(),
## OriginalPublicationYear = col_double(),
## read_time = col_double(),
## MyRating = col_double(),
## Gender = col_double(),
## Fiction = col_double(),
## Childrens = col_double(),
## Fantasy = col_double(),
## SciFi = col_double(),
## Mystery = col_double(),
## SelfHelp = col_double()
## )

No meu conjunto de dados de leitura, eu podia calcular uma soma acumulada dos meus dias de leitura e, em seguida, plotar isso em relação ao dia do ano (dias numerados de 1 a 365), para ver onde eu poderia ter tido lacunas nos meus hábitos de leitura.

## 
## Attaching package: 'lubridate'
## The following object is masked from 'package:base':
##
## date
reads2019  reads2019 %>%
mutate(date_started = as.Date(reads2019$date_started, format = '%m/%d/%Y'),
date_read = as.Date(date_read, format = '%m/%d/%Y'),
days_reading = order_by(date_read, cumsum(read_time)),
DOY = yday(date_read))

Uma rápida olhada nos meus dados mostra um problema: meu primeiro livro lido em 2019 foi realmente iniciado em 2018, portanto, os dias gastos lendo são maiores que o dia numerado do ano. Provavelmente eu deveria corrigir isso e, em seguida, recalcular minha variável days_reading.

Leia Também  Roger Bivand - Análise de dados espaciais aplicada com R - retrospecto e prospecção
cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br
reads2019  reads2019 %>%
mutate(read_time = ifelse(read_time > DOY, DOY, read_time),
days_reading = order_by(date_read, cumsum(read_time)))

Agora eu posso traçar dias lendo contra o dia do ano.

reads2019 %>%
ggplot(aes(DOY, days_reading)) +
geom_point() +
scale_x_continuous(breaks = seq(, 380, 20)) +
scale_y_continuous(breaks = seq(, 360, 20)) +
xlab("Day of Year") +
ylab("Days Reading")

Com base nesse gráfico, tenho poucas lacunas nos meus hábitos de leitura, mas, no geral, li 341 dias ao ano. Há também lugares em que eu estava claramente lendo dois livros ao mesmo tempo, bem como lugares em que terminei um livro por dia e depois iniciei e terminei outro no mesmo dia (alguns dos livros que li eram curtos).

Outro uso potencial para order_by é com a função de preenchimento, que preenche os valores ausentes da entrada da coluna seguinte ou anterior. Se você estava fazendo um estudo em que as pessoas recebem medidas repetidas e perdem uma das medidas, ou se o seu conjunto de dados apenas observa um novo valor quando o anterior foi alterado, você pode usar o preenchimento para copiar valores anteriores para as células vazias.

Amanhã, falaremos mais sobre o pacote de escalas, para aprimorar seus ggplots!





cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br