Deseja compartilhar seu conteúdo com R-blogueiros? clique aqui se você tiver um blog ou aqui se não tiver.
Faça seus primeiros passos com o ggplot2 pacote para criar um gráfico de dispersão. Use a gramática dos gráficos para mapear os atributos do conjunto de dados ao seu gráfico e conectar diferentes camadas usando o +
operador.
- Defina um conjunto de dados para o gráfico usando o
ggplot()
função - Especifique uma camada geométrica usando o
geom_point()
função - Mapeie atributos do conjunto de dados para plotar propriedades usando o método
mapping
parâmetro - Ligue diferentes
ggplot
objetos usando o+
operador
library(ggplot2) ggplot(___) + geom_point( mapping = aes(x = ___, y = ___) )
Contents
- 1 Introdução aos gráficos de dispersão
- 2 Quiz: Fatos sobre o gráfico de dispersão
- 3 Especificando um conjunto de dados
- 4 Exercício: Especifique o conjunto de dados gapminder
- 5 Especificando uma camada geométrica
- 6 Quiz: Camadas de plotagem de dispersão
- 7 Criando mapeamentos estéticos
- 8 Exercício: visualize o conjunto de dados “carros”
- 9 Exercício: Visualize o conjunto de dados Gapminder
Introdução aos gráficos de dispersão
Os gráficos de dispersão usam pontos para visualizar o relacionamento entre duas variáveis numéricas. A posição de cada ponto representa o valor das variáveis nos eixos xe y. Vamos ver um exemplo de gráfico de dispersão para entender a relação entre o Rapidez e a distância de parada de carros:
Cada ponto representa um carro. Cada carro começa a quebrar na velocidade indicada no eixo y e percorre a distância mostrada no eixo x até o ponto final. Se dermos uma olhada em todos os pontos da trama, podemos ver claramente que são necessários carros mais rápidos por uma distância maior até que sejam completamente parados.
Quiz: Fatos sobre o gráfico de dispersão
Quais das seguintes afirmações sobre gráficos de dispersão estão corretas?
- Gráficos de dispersão visualizam a relação de duas variáveis numéricas
- Em um gráfico de dispersão, interpretamos apenas pontos únicos e nunca a relação entre as variáveis em geral
- Gráficos de dispersão usam pontos para visualizar observações
- Gráficos de dispersão visualizam a relação de variáveis categóricas e numéricas
Iniciar teste
Especificando um conjunto de dados
library(ggplot2) ggplot(___) + geom_point( mapping = aes(x = ___, y = ___) )
Para criar plotagens com ggplot2 primeiro você precisa carregar o pacote usando library(ggplot2)
.
Após o carregamento do pacote, especifique o conjunto de dados a ser usado como argumento do ggplot()
função. Por exemplo, para especificar uma plotagem usando o cars
conjunto de dados que você pode usar:
library(ggplot2) ggplot(cars)
Observe que esse comando ainda não plota nada além de uma tela cinza. Ele apenas define o conjunto de dados para o gráfico e cria uma base vazia sobre a qual podemos adicionar camadas adicionais.
Exercício: Especifique o conjunto de dados gapminder
Para começar com um ggplot visualizando o gapminder
conjunto de dados, precisamos:
- Carregue o ggplot2 pacote
- Carregue o gapminder pacote
- Defina a
gapminder
conjunto de dados a ser usado no gráfico com oggplot()
função
Iniciar exercício
Especificando uma camada geométrica
library(ggplot2) ggplot(___) + geom_point( mapping = aes(x = ___, y = ___) )
Podemos usar ggplotcamadas geométricas (ou geoms) para definir como queremos visualizar nosso conjunto de dados. Geoms use objetos geométricos para visualizar as variáveis de um conjunto de dados. Os objetos podem ter várias formas, como pontos, linhas e barras, e são especificados através das funções correspondentes geom_point()
, geom_line()
e geom_col()
:
Quiz: Camadas de plotagem de dispersão
Qual camada geométrica deve ser usada para criar gráficos de dispersão em ggplot2?
point_geom()
geom()
geom_scatter()
geom_point()
Iniciar teste
Criando mapeamentos estéticos
library(ggplot2) ggplot(___) + geom_point( mapping = aes(x = ___, y = ___) )
ggplot2 usa o conceito de estética, qual mapa atributos do conjunto de dados para os recursos visuais do gráfico. Cada camada geométrica requer um conjunto diferente de mapeamentos estéticospor exemplo, o geom_point()
função usa a estética x
e y
para determinar as coordenadas dos eixos x e y dos pontos a serem plotados. A estética é mapeada dentro do aes()
para construir os mapeamentos finais.
Para especificar uma camada de pontos que plota a variável speed
no eixo x e distância dist
no eixo y, podemos escrever:
geom_point( mapping = aes(x=speed, y=dist) )
A expressão acima constrói uma camada geométrica. No entanto, atualmente, essa camada não está vinculada a um conjunto de dados e não produz um gráfico. Para ligação a camada com um ggplot
objeto especificando o cars
conjunto de dados, precisamos conectar o ggplot(cars)
objeto com o geom_point()
camada usando o +
operador:
ggplot(cars) + geom_point( mapping = aes(x=speed, y=dist) )
Através da ligação ggplot()
sabe que o mapeado speed
e dist
variáveis são retiradas do cars
conjunto de dados. geom_point()
instrui o ggplot a plotar as variáveis mapeadas como pontos.
As etapas necessárias para criar um gráfico de dispersão com ggplot
pode ser resumido da seguinte forma:
- Carregue o pacote ggplot2 usando
library(ggplot2)
. - Especifique o conjunto de dados a ser plotado usando
ggplot()
. - Use o
+
operador para adicionar camadas ao gráfico. - Adicione uma camada geométrica para definir as formas a serem plotadas. No caso de gráficos de dispersão, use
geom_point()
. - Mapeie variáveis do conjunto de dados para plotar propriedades por meio do
mapping
parâmetro na camada geométrica.
Exercício: visualize o conjunto de dados “carros”
Crie um gráfico de dispersão usando ggplot()
e visualize o cars
conjunto de dados com a distância de parada do carro dist
no eixo xe no speed
do carro no eixo y.
o ggplot2 o pacote já está carregado. Siga estas etapas para criar a plotagem:
- Especifique o conjunto de dados através do
ggplot()
função - Especifique uma camada de ponto geométrico com o
geom_point()
função - Mapeie o
speed
para o eixo x e odist
para o eixo y comaes()
Iniciar exercício
Exercício: Visualize o conjunto de dados Gapminder
Crie um gráfico de dispersão usando ggplot()
e visualize o gapminder_2007
conjunto de dados com o PIB per capita gdpPercap
no eixo x e a expectativa de vida lifeExp
de cada país no eixo y.
o ggplot2 o pacote já está carregado. Siga estas etapas para criar a plotagem:
- Especifique o
gapminder_2007
conjunto de dados através doggplot()
função - Especifique uma camada de ponto geométrico com
geom_point()
. - Mapeie o
gdpPercap
para o eixo x e olifeExp
para o eixo y comaes()
Iniciar exercício
Criar um gráfico de dispersão com ggplot é um trecho do curso Introdução ao R, disponível gratuitamente em quantargo.com
VER CURSO COMPLETO
Relacionado