M é para mutação | R-bloggers

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br

[ad_1]

[Esteartigofoipublicadopelaprimeiravezem[Thisarticlewasfirstpublishedon Profundamente Trivial, e gentilmente contribuiu para os R-blogueiros]. (Você pode relatar um problema sobre o conteúdo desta página aqui)


Deseja compartilhar seu conteúdo com R-blogueiros? clique aqui se você tiver um blog ou aqui se não tiver.

Hoje, finalmente falamos sobre a função mutate! Eu o usei muito ao longo da série até agora, então é bom discutir o que é e como funciona.

A função mutate é usada sempre que você deseja criar ou modificar uma variável. Ele funciona com praticamente qualquer função R que cria / modifica variáveis, para que você possa envolvê-lo em código para criar fatores, código R base para estatísticas descritivas (como mediana, média, desvio padrão), converter um caractere em um número (ou vice-versa) versa), calcule uma diferença de data e assim por diante, além de usar quaisquer operações aritméticas ou lógicas. Você pode incluir várias variáveis ​​novas e / ou modificadas em sua função mutate e até criar ou alterar variáveis ​​usando aquelas criadas no mesmo comando mutate. Vamos demonstrar, novamente, com o conjunto de dados de leitura (se você estiver tocando em casa, mais uma vez, poderá fazer o download desse arquivo aqui).

## -- Attaching packages -------------------------------------------------------------------------------- tidyverse 1.3.0 --
##  ggplot2 3.2.1      purrr   0.3.3
## tibble 2.1.3 dplyr 0.8.3
## tidyr 1.0.0 stringr 1.4.0
## readr 1.3.1 forcats 0.4.0
## -- Conflicts ----------------------------------------------------------------------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
reads2019  read_csv("~/Downloads/Blogging A to Z/SaraReads2019_allrated.csv", col_names = TRUE)
## Parsed with column specification:
## cols(
## Title = col_character(),
## Pages = col_double(),
## date_started = col_character(),
## date_read = col_character(),
## Book.ID = col_double(),
## Author = col_character(),
## AdditionalAuthors = col_character(),
## AverageRating = col_double(),
## OriginalPublicationYear = col_double(),
## read_time = col_double(),
## MyRating = col_double(),
## Gender = col_double(),
## Fiction = col_double(),
## Childrens = col_double(),
## Fantasy = col_double(),
## SciFi = col_double(),
## Mystery = col_double(),
## SelfHelp = col_double()
## )

Usando esse conjunto de dados, vou criar e modificar várias variáveis ​​- vou transformar alguns dos meus sinalizadores de gênero em fatores, o que ajuda na visualização de dados; converter minhas datas de início e término de variáveis ​​de caractere para data; extrair o dia da semana em que comecei e terminei cada livro; e rotular livros com base em se eles foram publicados recentemente (nos últimos cinco anos) ou mais antigos.

Leia Também  Société Générale entra em operação com as soluções Fusion Risk da Finastra
cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br
## 
## Attaching package: 'lubridate'
## The following object is masked from 'package:base':
##
## date
reads2019  reads2019 %>%
mutate(Fiction = factor(Fiction,
levels = c(,1),
labels = c("Non-Fiction", "Fiction")),
Fantasy = factor(Fantasy, levels = c(,1),
labels = c("Non-Fantasy", "Fantasy")),
SciFi = factor(SciFi,
levels = c(,1),
labels = c("Non-Science Fiction", "Science Fiction")),
date_started = as.Date(reads2019$date_started, format = '%m/%d/%Y'),
date_read = as.Date(date_read, format = '%m/%d/%Y'),
StartDay = wday(date_started, label = TRUE, abbr = FALSE),
FinishDay = wday(date_read, label = TRUE, abbr = FALSE),
Age = ifelse(OriginalPublicationYear >= 2015, 1, ),
Age = factor(Age,
levels = c(,1),
labels = c("New Publication", "Older Publication")))

Observe que eu criei a variável Age e a transformei em um fator. Por isso, não há problema em usar uma variável recém-criada no mesmo agrupamento alternativo. Também converti as datas dos meus personagens em formato de data para poder extrair o dia da semana (wday, uma função do lubridato). De fato, esse bloco de código mutante inclui as funções base R e arrumado. Eu poderia até puxar funções de outros pacotes R. Basicamente, qualquer código que você usou para escrever como variável de dados $

% de dados
mutate (variável = f (variável))

Claro, parece mais detalhado quando você está fazendo uma alteração rápida, mas a alteração dos conjuntos de dados geralmente envolve várias variáveis ​​e pode exigir que você use o mutate com filtros ou group_bys. Isso torna o arrumado muito mais poderoso e limpo.

As coisas estão esquentando esta semana no trabalho e estou perigosamente atrasado nas postagens do blog – escrevi bastante antes, mas fiquei ocupado e agora estou escrevendo esta postagem apenas na noite anterior ao lançamento. Esperando fazer alguma recuperação ainda hoje à noite, mas a postagem de quinta-feira (e / ou posteriores da série) pode demorar um pouco. Não se preocupe! Nós vamos passar de A a Z de alguma forma!

Leia Também  As probabilidades implícitas nas probabilidades de apostas: Introdução ao pacote 'implícito'


Se você chegou até aqui, por que não inscreva-se para atualizações do site? Escolha seu sabor: e-mail, Twitter, RSS ou facebook …



[ad_2]

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br