Q é para qplot versus ggplot

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br


[Esteartigofoipublicadopelaprimeiravezem[Thisarticlewasfirstpublishedon Profundamente Trivial, e gentilmente contribuiu para R-blogueiros]. (Você pode relatar um problema sobre o conteúdo desta página aqui)


Deseja compartilhar seu conteúdo com R-blogueiros? clique aqui se você tiver um blog ou aqui se não tiver.

Dois anos atrás, quando eu escrevi no Blog A a Z of R, falei sobre qplots. qplots são ótimos para gráficos rápidos – e é por isso que eles são nomeados como tal – porque eles usam tipos de variáveis ​​para determinar o melhor gráfico a ser gerado. Por exemplo, se eu der uma única variável contínua, ela gerará um histograma.

Se eu der 2 variáveis ​​contínuas, ele gera um gráfico de dispersão.

Se eu der um fator, ele gera um gráfico de barras.

E assim por diante. Agora, ao longo de toda esta série, e em muitas outras estatísticas e postagens R, tenho usado o ggplot, em vez do qplot. E raramente, se é que alguma vez, uso o qplot atualmente, mesmo para visualizações rápidas de dados. Diferente do qplot, o ggplot exige que você especifique o tipo exato de plotagem que deseja criar, usando um geom_ no seu código. E se você solicitar um tipo de geom que não possa ser criado com o tipo de dados que possui, você receberá um erro. Para criar um ggplot, é necessário saber que tipo de dados você tem e como deseja que eles sejam visualizados. Apesar (ou talvez por causa disso), eu prefiro fortemente o ggplot e o incentivaria a usá-lo também.

Existem maneiras quase infinitas de personalizar um ggplot – transformando escalas, adicionando esquemas de cores, camadas de dados, alterando fontes – que permitem criar um gráfico sofisticado, schmancy e pronto para publicação. Se você planeja publicar ou apresentar seu trabalho, você realmente deseja usar ggplots em vez de qplots. qplots são como o primeiro rascunho do seu manuscrito – ninguém o vê além de você. Mas, nesse caso, é um primeiro rascunho que você pode pular direto; basta ir direto ao enredo bonito.
Segundo, você percebe que eu não usei o tubo principal nos meus qplots acima. Isso porque se você tentar, você recebe um erro.

reads2019 %>%
qplot(Pages, read_time)
## Error in FUN(X[[i]], ...): object 'read_time' not found

O tubo de exposição funciona, no entanto.

## 
## Attaching package: 'magrittr'
## The following object is masked from 'package:purrr':
##
## set_names
## The following object is masked from 'package:tidyr':
##
## extract
reads2019 %$%
qplot(Pages)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

Mas o lado ruim do cano principal não funcionar é que isso significa que você não pode combinar verbos ordenados, como filtros, com o código da plotagem. Você precisa criar uma versão separada de seus dados e usá-la com o qplot. Para conjuntos de dados realmente grandes, talvez você não tenha muita memória de sobra. O ggplot, por outro lado, funciona maravilhosamente com o cano principal.

O ggplot é realmente a abordagem mais poderosa, mais bonita e infinitamente personalizável para plotar dados. Pode ser um desafio entender o assunto no início e não há problema em facilitar o caminho. Existem muitos recursos excelentes para aprender o pacote ggplot2 e, especificamente, a função ggplot desse pacote. Para começar, confira esta grande folha de dicas. Você também pode conferir o livro de Hadley Wickham, que ele oferece gratuitamente on-line. (A propósito, Hadley Wickham desenvolveu o pacote ggplot2, juntamente com muitos outros.)

Espero que você esteja gostando dessa série até agora!



Se você chegou até aqui, por que não inscreva-se para atualizações do site? Escolha o seu sabor: o email, Twitter, RSS ou facebook …



cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br
Leia Também  nnlib2Rcpp: um pacote R (nother) para redes neurais