M é para mutação | R-bloggers

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br


[Esteartigofoipublicadopelaprimeiravezem[Thisarticlewasfirstpublishedon Profundamente Trivial, e gentilmente contribuiu para os R-blogueiros]. (Você pode relatar um problema sobre o conteúdo desta página aqui)


Deseja compartilhar seu conteúdo com R-blogueiros? clique aqui se você tiver um blog ou aqui se não tiver.

Hoje, finalmente falamos sobre a função mutate! Eu o usei muito ao longo da série até agora, então é bom discutir o que é e como funciona.

A função mutate é usada sempre que você deseja criar ou modificar uma variável. Ele funciona com praticamente qualquer função R que cria / modifica variáveis, para que você possa envolvê-lo em código para criar fatores, código R base para estatísticas descritivas (como mediana, média, desvio padrão), converter um caractere em um número (ou vice-versa) versa), calcule uma diferença de data e assim por diante, além de usar quaisquer operações aritméticas ou lógicas. Você pode incluir várias variáveis ​​novas e / ou modificadas em sua função mutate e até criar ou alterar variáveis ​​usando aquelas criadas no mesmo comando mutate. Vamos demonstrar, novamente, com o conjunto de dados de leitura (se você estiver tocando em casa, mais uma vez, poderá fazer o download desse arquivo aqui).

## -- Attaching packages -------------------------------------------------------------------------------- tidyverse 1.3.0 --
##  ggplot2 3.2.1      purrr   0.3.3
## tibble 2.1.3 dplyr 0.8.3
## tidyr 1.0.0 stringr 1.4.0
## readr 1.3.1 forcats 0.4.0
## -- Conflicts ----------------------------------------------------------------------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
reads2019  read_csv("~/Downloads/Blogging A to Z/SaraReads2019_allrated.csv", col_names = TRUE)
## Parsed with column specification:
## cols(
## Title = col_character(),
## Pages = col_double(),
## date_started = col_character(),
## date_read = col_character(),
## Book.ID = col_double(),
## Author = col_character(),
## AdditionalAuthors = col_character(),
## AverageRating = col_double(),
## OriginalPublicationYear = col_double(),
## read_time = col_double(),
## MyRating = col_double(),
## Gender = col_double(),
## Fiction = col_double(),
## Childrens = col_double(),
## Fantasy = col_double(),
## SciFi = col_double(),
## Mystery = col_double(),
## SelfHelp = col_double()
## )

Usando esse conjunto de dados, vou criar e modificar várias variáveis ​​- vou transformar alguns dos meus sinalizadores de gênero em fatores, o que ajuda na visualização de dados; converter minhas datas de início e término de variáveis ​​de caractere para data; extrair o dia da semana em que comecei e terminei cada livro; e rotular livros com base em se eles foram publicados recentemente (nos últimos cinco anos) ou mais antigos.

Leia Também  Extrapolando com splines B e GAMs
cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br
## 
## Attaching package: 'lubridate'
## The following object is masked from 'package:base':
##
## date
reads2019  reads2019 %>%
mutate(Fiction = factor(Fiction,
levels = c(,1),
labels = c("Non-Fiction", "Fiction")),
Fantasy = factor(Fantasy, levels = c(,1),
labels = c("Non-Fantasy", "Fantasy")),
SciFi = factor(SciFi,
levels = c(,1),
labels = c("Non-Science Fiction", "Science Fiction")),
date_started = as.Date(reads2019$date_started, format = '%m/%d/%Y'),
date_read = as.Date(date_read, format = '%m/%d/%Y'),
StartDay = wday(date_started, label = TRUE, abbr = FALSE),
FinishDay = wday(date_read, label = TRUE, abbr = FALSE),
Age = ifelse(OriginalPublicationYear >= 2015, 1, ),
Age = factor(Age,
levels = c(,1),
labels = c("New Publication", "Older Publication")))

Observe que eu criei a variável Age e a transformei em um fator. Por isso, não há problema em usar uma variável recém-criada no mesmo agrupamento alternativo. Também converti as datas dos meus personagens em formato de data para poder extrair o dia da semana (wday, uma função do lubridato). De fato, esse bloco de código mutante inclui as funções base R e arrumado. Eu poderia até puxar funções de outros pacotes R. Basicamente, qualquer código que você usou para escrever como variável de dados $

% de dados
mutate (variável = f (variável))

Claro, parece mais detalhado quando você está fazendo uma alteração rápida, mas a alteração dos conjuntos de dados geralmente envolve várias variáveis ​​e pode exigir que você use o mutate com filtros ou group_bys. Isso torna o arrumado muito mais poderoso e limpo.

As coisas estão esquentando esta semana no trabalho e estou perigosamente atrasado nas postagens do blog – escrevi bastante antes, mas fiquei ocupado e agora estou escrevendo esta postagem apenas na noite anterior ao lançamento. Esperando fazer alguma recuperação ainda hoje à noite, mas a postagem de quinta-feira (e / ou posteriores da série) pode demorar um pouco. Não se preocupe! Nós vamos passar de A a Z de alguma forma!

Leia Também  Archive Existing RDS Files | R-bloggers


Se você chegou até aqui, por que não inscreva-se para atualizações do site? Escolha seu sabor: e-mail, Twitter, RSS ou facebook …



cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br