Como fazer gráficos de dispersão impressionantes em R: um guia completo com ggplot2

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br


Miniatura do artigo - Gráficos de dispersão

Gráficos de dispersão com R

Você quer fazer visualizações impressionantes, mas elas sempre acabam parecendo uma batata? É um lugar difícil de estar. Felizmente, o R facilita a produção de visuais de ótima aparência. Hoje você aprenderá a criar gráficos de dispersão impressionantes com R e o ggplot2 pacote.

Leia a série desde o início:

Este artigo demonstra como fazer um gráfico de dispersão para qualquer ocasião e como torná-lo extraordinário ao mesmo tempo. Após a leitura, visualizar relações entre quaisquer variáveis ​​contínuas não deve ser um problema. Hoje você aprenderá como:

Faça seu primeiro gráfico de dispersão

R tem muitos conjuntos de dados integrados, e um deles é mtcars. É um dos conjuntos de dados mais populares e hoje você o usará para fazer muitos gráficos de dispersão. Em termos de pacote, você só precisa ggplot2.

Veja como importar os pacotes e dê uma olhada nas primeiras linhas:

Imagem 1 - Chefe do conjunto de dados MTCars

Imagem 1 – Chefe do conjunto de dados MTCars

O pacote R mais amplamente usado para visualização de dados é ggplot2. É um pacote simples baseado no princípio de camadas. A primeira camada é usada para especificar os dados e as camadas seguintes são usadas para fazer e ajustar a visualização.

o geom_point() camada é usada para desenhar gráficos de dispersão. Seu primeiro gráfico mostrará a relação entre o mpg atributo no eixo x, e o hp coluna no eixo y:

Imagem 2 - Relação entre as variáveis ​​MPG e HP

Imagem 2 – Relação entre as variáveis ​​MPG e HP

Concordamos com você – não é a visualização mais bonita. Você aprenderá como lidar com isso nas seções a seguir.

Alterar tamanho, cor, forma e tema

Você não pode fazer visuais impressionantes com estilos padrão. Você pode mudar algumas coisas no geom_point() camada, como forma, cor, tamanho e assim por diante.

Veja como tornar os pontos azuis e um pouco maiores:

Imagem 3 - Mudando tamanho e cor

Imagem 3 – Mudando tamanho e cor

Melhor, mas e se você não quiser codificar os valores de cor e tamanho? Você pode colocar nomes de variáveis ​​em seu lugar. Veja como alterar a cor com base no cyl variável e tamanho por qsec:

Imagem 4 - Mudança de tamanho e cor por variáveis

Imagem 4 – Mudança de tamanho e cor por variáveis

Mudar de forma também é simples. Os pontos não são apropriados para todos os casos de uso, e você está livre para alterar a forma com o shape atributo. Você pode encontrar a lista de todas as formas disponíveis aqui.

O seguinte snippet de código substitui os pontos por triângulos:

Imagem 5 - Substituindo pontos por triângulos

Imagem 5 – Substituindo pontos por triângulos

E por fim, vamos falar sobre temas. O padrão não é para todos porque é um pouco duro com o fundo. Com R, você pode alterar o tema com uma única linha de código:

Imagem 6 - Alterando o tema do gráfico

Imagem 6 – Alterando o tema do gráfico

Agora isso é progresso. Mas ainda não está lá. Vamos ver como adicionar texto e rótulos a seguir.

Adicionar texto e rótulos

Você pode usar texto e rótulos para adicionar informações adicionais às suas visualizações. A única diferença entre os dois é que há uma caixa ao redor dos rótulos, facilitando a leitura.

Veja como adicionar texto para representar nomes de carros:

Imagem 7 - Adicionando texto à visualização

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br

Imagem 7 – Adicionando texto à visualização

o ggrepel o pacote está aqui para evitar a sobreposição entre o texto. Você pode adicionar texto com o plano geom_text camada, mas seria impossível ler o texto para os pontos que estão próximos.

Se ainda não estiver tão legível quanto você gostaria, use rótulos em vez de texto. Veja como:

Imagem 8 - Adicionando rótulos à visualização

Imagem 8 – Adicionando rótulos à visualização

A visualização não é completa sem rótulos de título e eixo. Vamos ver como adicionar e estilizar isso a seguir.

Adicionar títulos, legendas, legendas ocultas e rótulos de eixo

Primeiro, você aprenderá como adicionar títulos, legendas e legendas ocultas ao gráfico. O título é obrigatório para qualquer visualização decente, e os outros dois podem ajudar a esclarecer ainda mais as coisas e para citar fontes, respectivamente.

A maneira mais conveniente de adicioná-los é por meio de um labs() camada. Recebe valores para title, subtitlee caption:

Imagem 9 - Adicionando título, subtítulo e legenda

Imagem 9 – Adicionando título, subtítulo e legenda

Por padrão, eles não parecem muito bons. Você pode alterar a cor, o tamanho, o alinhamento e enfatizar / colocar em itálico o texto no theme() camada. Veja como:

Imagem 10 - Estilo, subtítulo e legenda

Imagem 10 – Estilo, subtítulo e legenda

Vamos falar sobre rótulos de eixo a seguir. Você pode alterá-los e estilizá-los da mesma forma que fazia com títulos, legendas e legendas ocultas – em labs() e theme() camadas.

O snippet de código abaixo adiciona rótulos para os eixos X e Y e os estiliza um pouco:

Imagem 11 - Adicionando e estilizando os rótulos dos eixos

Imagem 11 – Adicionando e estilizando os rótulos dos eixos

Para encerrar, vamos dar uma olhada em alguns ajustes úteis que você pode fazer para dispersar gráficos que não se enquadram em nenhuma das seções discutidas.

Adicionar outras coisas úteis

Vamos começar mudando a posição da legenda. A posição padrão à direita pode não ser a melhor para alguns casos de uso. Você pode colocar a legenda no topo adicionando o legend.position argumento para o theme() camada e especificando a posição.

Aqui está um exemplo:

Imagem 12 - Mudando a posição da legenda

Imagem 12 – Mudando a posição da legenda

A outra camada potencialmente útil que você pode usar é geom_rug(). Mostra a distribuição da variável nas bordas dos eixos X e Y para as variáveis ​​especificadas.

Veja como usá-lo:

Imagem 13 - Adicionando a camada geom_rug ()

Com esta camada, você pode ter uma ideia aproximada de como suas variáveis ​​estão distribuídas e em que ponto (s) a maioria das observações está localizada.

Conclusão

Hoje você aprendeu como fazer gráficos de dispersão com R e ggplot2 e como torná-los esteticamente agradáveis. Você aprendeu como alterar cores, tipos de marcadores, tamanho, títulos, legendas, legendas, rótulos de eixo e algumas outras coisas úteis.

Isso por si só será suficiente para fazer quase qualquer visualização de dados que você possa imaginar. Cabe a você escolher um tema, cor e título apropriados.

Você pode esperar mais tutoriais R básicos semanais. Preencha o formulário de inscrição abaixo, para que você nunca perca uma atualização.

BQ: Você é completamente novo no R, mas tem alguma experiência em programação? Confira nosso guia R detalhado para programadores.

Saber mais:

Appsilon está contratando para funções remotas! Veja nosso Carreiras página para todas as vagas em aberto, incluindo R Shiny Developers, Fullstack Engineers, Frontend Engineers, um Senior Infrastructure Engineer, e um Gerente de Comunidade. Junte-se à Appsilon e trabalhe em projetos inovadores com as empresas Fortune 500 mais influentes do mundo.

Artigo Como fazer gráficos de dispersão impressionantes em R: Um guia completo com ggplot2 vem de Appsilon | Soluções de ciência de dados de ponta a ponta.



cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br
Leia Também  Economia empírica com R (Parte A): a fórmula do vinho e o aprendizado de máquina