Leitura de arquivo JSON da web e preparação de dados para análise

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br


Bem-vindo ao artigo objetivo sobre como ler um arquivo JSON da web e preparar os dados para análise. Encontrei esses dados no formato JSON aqui e usei-os para replicar a tabela apresentada aqui na seção “Linhas e colunas”.

Os dados finais preparados neste artigo estão no formato de quadro de dados, que pode se transformar em um gráfico confortavelmente.

Dados

Os dados usados ​​neste artigo estão disponíveis aqui e licenciados sob a licença CC BY 4.0.

Estratégia

A estratégia é ler o arquivo JSON usando a função fromJSON do pacote jsonlite. A saída será apresentada como uma lista de listas. Leia listas individuais e, com a ajuda de funções rápidas e exclusivas, extraia o valor dos rótulos. Repita isso para todos os dados necessários para formar um quadro de dados.

A seção de valor do arquivo JSON retorna os elementos na forma de um vetor numérico. Leia os vetores adicionando três em seus índices e atribua-os a uma nova variável. Lembre-se de começar do primeiro, segundo e terceiro lugares para ler o elemento certo. Repita essa lógica três vezes para criar três variáveis. Use a mesma lógica e crie mais duas variáveis, uma para o ano e outra para estatísticas.

Código

Aqui está a cópia de trabalho do código para sua análise. Por favor, comente se você tem uma maneira melhor e mais otimizada de lidar com esses dados. Se você estiver interessado, uma cópia deste código também está disponível no repositório github.


library(jsonlite)


djson "https://statbank.cso.ie/StatbankServices/StatbankServices.svc/jsonservice/responseinstance/CIS78"

)


df
unique(rapply(djson$dataset$dimension$`Type of Cooperation Partner`$category$label, function(lst) head(lst, 1))),
V2 = djson$dataset$value[seq(1, length(djson$dataset$value), 3)],
V3 = djson$dataset$value[seq(2, length(djson$dataset$value), 3)],
V4 = djson$dataset$value[seq(3, length(djson$dataset$value), 3)],
V5 = djson$dataset$value[seq(1, length(djson$dataset$value), 3)],
V6 = djson$dataset$value[seq(2, length(djson$dataset$value), 3)])


colnames(df) = c(djson$dataset$dimension$`Type of Cooperation Partner`$label,
unique(rapply(djson$dataset$dimension$`NACE Rev 2 Sector`$category$label, function(lst) head(lst, 1))),
unique(rapply(djson$dataset$dimension$Year$category$label, function(lst) head(lst, 1))),
unique(rapply(djson$dataset$dimension$Statistic$category$label, function(lst) head(lst, 1))))


str(df)

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br
## 'data.frame':    12 obs. of  6 variables:
## $ Type of Cooperation Partner : chr "Any type of cooperation" "Cooperation from clients and or customers" "Cooperation from competitors" "Cooperation other enterprises within own enterprise group" ...
## $ Industries (05 to 39) : num 54.7 34.9 21.5 29 30 45.8 43.8 27 15.9 44.6 ...
## $ Industries and selected services (05 to 39,46,49 to 53,58 to 63,64 to 66,71 to 73): num 50.8 32.9 20.2 27.4 25.8 40.1 38.7 23.3 17.3 41.9 ...
## $ Selected Services (46, 49-53, 58-63, 64-66, 71-73) : num 47.8 31.5 19.3 26.3 22.7 35.9 34.8 20.5 18.5 39.9 ...
## $ 2018 : num 54.7 34.9 21.5 29 30 45.8 43.8 27 15.9 44.6 ...
## $ Co-operation by Technological Innovative Enterprises (%) : num 50.8 32.9 20.2 27.4 25.8 40.1 38.7 23.3 17.3 41.9 ...

df
##                                                                                   Type of Cooperation Partner
## 1 Any type of cooperation
## 2 Cooperation from clients and or customers
## 3 Cooperation from competitors
## 4 Cooperation other enterprises within own enterprise group
## 5 Cooperation from Universities and or third level institutions
## 6 Cooperation from suppliers of equipment, materials, components or software
## 7 Cooperation from consultants and or commercial laboratories or private research and development institutes
## 8 Cooperation from Government or public research institutes
## 9 Cooperation from public sector clients or customers
## 10 Cooperation from private business enterprises outside your enterprise group
## 11 Cooperation from other enterprises
## 12 Cooperation from non-profit organisations
## Industries (05 to 39)
## 1 54.7
## 2 34.9
## 3 21.5
## 4 29.0
## 5 30.0
## 6 45.8
## 7 43.8
## 8 27.0
## 9 15.9
## 10 44.6
## 11 22.7
## 12 11.3
## Industries and selected services (05 to 39,46,49 to 53,58 to 63,64 to 66,71 to 73)
## 1 50.8
## 2 32.9
## 3 20.2
## 4 27.4
## 5 25.8
## 6 40.1
## 7 38.7
## 8 23.3
## 9 17.3
## 10 41.9
## 11 21.5
## 12 12.5
## Selected Services (46, 49-53, 58-63, 64-66, 71-73) 2018
## 1 47.8 54.7
## 2 31.5 34.9
## 3 19.3 21.5
## 4 26.3 29.0
## 5 22.7 30.0
## 6 35.9 45.8
## 7 34.8 43.8
## 8 20.5 27.0
## 9 18.5 15.9
## 10 39.9 44.6
## 11 20.6 22.7
## 12 13.4 11.3
## Co-operation by Technological Innovative Enterprises (%)
## 1 50.8
## 2 32.9
## 3 20.2
## 4 27.4
## 5 25.8
## 6 40.1
## 7 38.7
## 8 23.3
## 9 17.3
## 10 41.9
## 11 21.5
## 12 12.5

Eu espero que você goste deste pequeno artigo. Ajude dataenq.com comentando sobre o que você pensa sobre este artigo e compartilhando-o com sua rede. Obrigado.



cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br
Leia Também  Superespalhamento e coeficiente de Gini