V é para verbos | R-bloggers

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br


[Esteartigofoipublicadopelaprimeiravezem[Thisarticlewasfirstpublishedon Profundamente Trivial, e gentilmente contribuiu para os R-blogueiros]. (Você pode relatar um problema sobre o conteúdo desta página aqui)


Deseja compartilhar seu conteúdo com R-blogueiros? clique aqui se você tiver um blog ou aqui se não tiver.

Nesta série, abordamos cinco termos para manipulação de dados:

Estes são os verbos que compõem a gramática da manipulação de dados. Todos eles trabalham com group_by para executar essas funções em grupo.

Existem versões com escopo desses verbos, que adicionam _all, _if ou _at, que permitem executar esses verbos em várias variáveis ​​simultaneamente. Por exemplo, eu poderia obter meios para todas as minhas variáveis ​​numéricas como esta. (Nota rápida: criei um conjunto de dados de leitura atualizado com todos os anos de publicação preenchidos. Você pode baixá-lo aqui.)

## -- Attaching packages ------------------------------------------- tidyverse 1.3.0 --
##  ggplot2 3.2.1      purrr   0.3.3
## tibble 2.1.3 dplyr 0.8.3
## tidyr 1.0.0 stringr 1.4.0
## readr 1.3.1 forcats 0.4.0
## -- Conflicts ---------------------------------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
reads2019  read_csv("~/Downloads/Blogging A to Z/SaraReads2019_allchanges.csv",
col_names = TRUE)
## Parsed with column specification:
## cols(
## Title = col_character(),
## Pages = col_double(),
## date_started = col_character(),
## date_read = col_character(),
## Book.ID = col_double(),
## Author = col_character(),
## AdditionalAuthors = col_character(),
## AverageRating = col_double(),
## OriginalPublicationYear = col_double(),
## read_time = col_double(),
## MyRating = col_double(),
## Gender = col_double(),
## Fiction = col_double(),
## Childrens = col_double(),
## Fantasy = col_double(),
## SciFi = col_double(),
## Mystery = col_double(),
## SelfHelp = col_double()
## )
reads2019 %>%
summarise_if(is.numeric, list(mean))
## # A tibble: 1 x 13
## Pages Book.ID AverageRating OriginalPublica… read_time MyRating Gender Fiction
##
## 1 341. 1.36e7 3.94 1989. 3.92 4.14 0.310 0.931
## # … with 5 more variables: Childrens , Fantasy , SciFi ,
## # Mystery , SelfHelp

Esta função gerou a média para cada variável numérica no meu conjunto de dados. Mas mesmo sendo todos numéricos, a média não é a melhor estatística para muitos deles, por exemplo, ID médio do livro ou ano de publicação. Poderíamos apenas gerar meios para variáveis ​​específicas com o resumo_at.

reads2019 %>%
summarise_at(vars(Pages, AverageRating, read_time, MyRating), list(mean))
## # A tibble: 1 x 4
## Pages AverageRating read_time MyRating
##
## 1 341. 3.94 3.92 4.14

Você também pode solicitar mais de uma informação na sua lista e solicitar que R crie um novo rótulo para cada variável.

numeric_summary  reads2019 %>%
summarise_at(vars(Pages, AverageRating, read_time, MyRating), list("mean" = mean, "median" = median))

Uso os verbos básicos sempre que uso R. Só aprendi sobre verbos com escopo recentemente e tenho certeza de que os adicionarei ao meu kit de ferramentas ao longo do tempo.

A próxima semana é a última semana de blogs de A a Z! Vejo você então!



Se você chegou até aqui, por que não inscreva-se para atualizações do site? Escolha o seu sabor: o email, Twitter, RSS ou facebook …



cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br
Leia Também  Visualização de redes multiníveis com layouts de gráficos