Aprendizado de máquina do Azure para profissionais de R com o R SDK

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br


[Esteartigofoipublicadopelaprimeiravezem[Thisarticlewasfirstpublishedon R-posts.com, e gentilmente contribuiu para os R-blogueiros]. (Você pode relatar um problema sobre o conteúdo desta página aqui)


Deseja compartilhar seu conteúdo com R-blogueiros? clique aqui se você tiver um blog ou aqui se não tiver.

[This article was first published on the Azure Medium channel, and kindly contributed to R-bloggers]. (Você pode relatar um problema sobre o conteúdo desta página aqui)


Como você provavelmente já sabe, a Microsoft forneceu seu SDK do Azure Machine Learning para Python para criar e executar fluxos de trabalho de aprendizado de máquina, ajudando as organizações a usar grandes conjuntos de dados e trazer todos os benefícios da nuvem do Azure para o aprendizado de máquina.

Embora a Microsoft tenha investido inicialmente no R como o idioma preferido do Advanced Analytics, introduzindo o servidor SQL Server R e os serviços R na versão 2016, eles abruptamente mudaram sua atenção para o Python, investindo exclusivamente nele. Isso aconteceu basicamente pelos seguintes motivos:

  • A simples sintaxe e legibilidade do Python tornam a linguagem acessível a não programadores
  • As bibliotecas de código-fonte aberto mais populares para aprendizado de máquina e aprendizado profundo (como Pandas, scikit-learn, TensorFlow, PyTorch, etc.) são profundamente usados ​​pela comunidade Python
  • Python é uma escolha melhor para produção: é relativamente muito rápido; implementa conceitos de POO de uma maneira melhor; é escalável (Hadoop / Spark); possui melhor funcionalidade para interagir com outros sistemas; etc.

Principais pontos principais do SDK do Python do Azure ML

Um dos aspectos mais valiosos do Python SDK é sua facilidade de uso e flexibilidade. Você pode simplesmente usar apenas algumas classes, injetando-as em seu código existente ou simplesmente consultando seus arquivos de script em chamadas de método, a fim de realizar as seguintes tarefas:

  • Explore seus conjuntos de dados e gerencie seu ciclo de vida
  • Acompanhe o que está acontecendo em suas experiências de aprendizado de máquina usando os recursos de rastreamento e registro do Python SDK
  • Transforme seus dados ou treine seus modelos localmente ou usando os melhores recursos de computação em nuvem necessários para suas cargas de trabalho
  • Registre seus modelos treinados na nuvem, empacote-os na imagem do contêiner e implante-os em serviços da Web hospedados nas Instâncias de Contêiner do Azure ou nos Serviços Kubernetes do Azure
  • Use Pipelines para automatizar fluxos de trabalho de tarefas de aprendizado de máquina (transformação de dados, treinamento, pontuação de lotes etc.)
  • Use o aprendizado automático de máquina (AutoML) para iterar em muitas combinações de pipelines de transformação de dados definidos, algoritmos de aprendizado de máquina e configurações de hiperparâmetros. Em seguida, ele encontra o modelo mais adequado com base na métrica de desempenho escolhida.
Leia Também  Webtool do Estudo Eleitoral da Nova Zelândia por @ ellis2013nz

Em resumo, o cenário é o seguinte:

Ciclo de vida de AI / ML usando o Azure ML
FIG. 1 – Ciclo de vida de AI / ML usando o Azure ML

E o envolvimento da comunidade R?

Nos últimos 3 anos, a Microsoft empurrou muito o SDK do Azure ML Python, tornando-o um produto estável e um cidadão de primeira classe da nuvem do Azure. Mas eles parecem ter esquecido todos os profissionais de R que desenvolveram uma enorme quantidade de projetos de ciência de dados em todo o mundo.

Não devemos esquecer que no Analytics e Data Science, a chave do sucesso de um projeto é experimentar rapidamente um grande número de ferramentas analíticas e descobrir qual é a melhor para o caso em análise. R nasceu por esse motivo. Possui muita flexibilidade quando você deseja trabalhar com dados e criar algum modelo, porque possui muitos pacotes e funcionalidade de visualização fácil de usar. É por isso que muitos projetos do Analytics são desenvolvidos usando R por muitos estatísticos e cientistas de dados.

Felizmente, nos últimos meses, a Microsoft estendeu a mão para a comunidade R, lançando um novo projeto chamado SDK do Azure Machine Learning R.

Posso usar R para girar as rodas ML do Azure?

A partir de outubro de 2019, a Microsoft lançou uma interface R para o SDK do Azure Machine Learning no GitHub. A ideia por trás deste projeto é realmente direta. O Azure ML Python SDK é uma maneira de simplificar o acesso e o uso do armazenamento e computação em nuvem do Azure para fins de aprendizado de máquina, mantendo o código principal como aquele desenvolvido por um cientista de dados em seu laptop.

Por que não permitir que a infraestrutura do Azure ML execute também o código R (usando imagens apropriadas do Docker “cozidas”) e permita que os cientistas de dados do R chamem os métodos SDK do Azure ML Python SDK usando funções R?

A interoperabilidade entre Python e R é obtida graças a reticulado. Então, uma vez que o módulo Python SDK azureml é importado para qualquer ambiente R usando a função de importação, funções e outros dados dentro do azureml pode ser acessado através do $ operador, como uma lista R.

Obviamente, a máquina que hospeda seu ambiente R também deve ter o Python instalado para fazer o R ​​SDK funcionar corretamente.

Vamos começar a configurar seu ambiente preferido.

Leia Também  Nova conta virtual CreDec ajuda PME a contornar os bancos

Configurar um ambiente de desenvolvimento para o R SDK

Há duas opções para começar a desenvolver com o R SDK:

  1. Usando uma Instância de Computação do Azure ML (a maneira mais rápida, mas não a mais barata!)
  2. Usando sua máquina (laptop, VM etc.)

Configurar uma instância de computação do Azure ML

Depois de criar um espaço de trabalho do Azure Machine Learning por meio do portal do Azure (uma edição básica é suficiente), você pode acessar o novo Azure Machine Learning Studio. Debaixo de Calcular seção, você pode criar uma nova instância de computação, escolhendo seu nome e seu tamanho:

Criar uma instância de computação do Azure ML
FIG. 2 – Criar uma instância de computação do Azure ML

A vantagem de usar uma Instância de computação é que o software e as bibliotecas mais usados ​​pelos cientistas de dados já estão instalados, incluindo o SDK do Azure ML Python SDK e o RStudio Server Open Source Edition. Dito isto, depois que sua Instância de computação for iniciada, você poderá se conectar ao RStudio usando o link apropriado:

Inicie o RStudio a partir de uma Intstance de computação iniciada
FIG. 3 – Inicie o RStudio a partir de uma Compute Intstance iniciada

No final da sua experiência, lembre-se de encerrar sua Instância de computação, caso contrário você será cobrado de acordo com o plano escolhido:

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br
Lembre-se de desligar sua instância de computação
FIG. 4 – Lembre-se de desligar sua instância de computação

Configure sua máquina do zero

Antes de tudo, você precisa instalar o mecanismo R do CRAN ou MRAN. Depois, você também pode instalar o RStudio Desktop, o IDE preferido dos profissionais de R.

A próxima etapa é instalar o Conda, porque o R SDK precisa se vincular ao Python SDK por meio de reticulado. Se você realmente não precisa do Anaconda para fins específicos, é recomendável instalar uma versão leve, Miniconda. Durante a instalação, deixe o instalador adicionar a instalação conda do Python à sua variável de ambiente PATH.

Instale o R SDK

Abra seu RStudio, simplesmente crie um novo script R (Arquivo → Novo Arquivo → Script R) e instale a última versão estável do pacote do Azure ML R SDK (azuremlsdk) disponível no CRAN da seguinte maneira:

install.packages("remotes")
remotes::install_cran("azuremlsdk")

Se você deseja instalar a versão mais recente confirmada do pacote no GitHub (talvez porque a equipe do produto tenha corrigido um bug irritante), você pode usar a seguinte função:

remotes::install_github('https://github.com/Azure/azureml-sdk-for-r')

Durante a instalação, você pode receber este erro:

Erro no fuso horário
FIG. 5 – Erro no fuso horário

Nesse caso, você só precisa definir o TZ variável de ambiente com seu fuso horário preferido:

Sys.setenv(TZ="GMT")

Em seguida, basta reinstalar o R ​​SDK.

Você também pode ser solicitado a atualizar alguns pacotes dependentes:

Pacotes dependentes a serem atualizados
FIG. 6 – Pacotes dependentes a serem atualizados

Se você não tem nenhum requisito sobre dependências no seu projeto, é sempre melhor atualizá-las todas (coloque o foco no prompt do console; pressione 1; pressione enter).

Se você estiver na sua Instância de computação e receber um aviso como o seguinte:

Leia Também  Por que R? Webinar - Ensino de aprendizado de máquina on-line
Aviso sobre a instalação não do sistema do Python
FIG. 7 – Aviso sobre instalação que não seja do sistema do Python

basta colocar o foco no console e pressione “n”, já que o ambiente da Compute Instance já possui uma instalação do Conda. Os engenheiros da Microsoft já estão investigando esse problema.

Você precisa instalar o SDK do Azure ML Python, caso contrário, seu azuremlsdk O pacote R não funcionará. Você pode fazer isso diretamente do RStudio, graças a um azuremlsdk função:

azuremlsdk::install_azureml(remove_existing_env = TRUE)

o remove_existing_env O parâmetro definido como TRUE removerá o ambiente padrão do Azure ML SDK reticulado se instalado anteriormente (é uma maneira de limpar uma instalação do Python SDK).

Lembre-se de que dessa forma você instalará a versão do SDK do Azure ML Python esperada pela sua versão instalada do azuremlsdk pacote. Você pode verificar qual versão instalará colocando o cursor sobre o install_azureml função e visualizando a definição de código clicando F2:

definição de código install_azureml
FIG. 8 – definição do código install_azureml

Às vezes, há novos recursos e correções na versão mais recente do Python SDK. Se você precisar instalá-lo, verifique primeiro qual versão está disponível neste link:

Versão mais recente do Azure ML Python SDK
FIG. 9 – Versão mais recente do Azure ML Python SDK

Em seguida, use esse número de versão no seguinte código:

azuremlsdk::install_azureml(version = "1.2.0", remove_existing_env = TRUE)

Às vezes, pode ser necessário instalar uma versão atualizada de um único componente do SDK do Azure ML Python para testar, por exemplo, novos recursos. Supondo que você deseje atualizar o SDK de preparação de dados do Azure ML, aqui o código que você pode usar:

reticulate::py_install("azureml-dataprep==1.4.2", envname = "r-reticulate", pip = TRUE)

Para verificar se a instalação está funcionando corretamente, tente o seguinte:

library(azuremlsdk)
get_current_run()

Deve retornar algo como isto:

Verificando se o azuremlsdk está instalado corretamente
FIG. 10 – Verificando se o azuremlsdk está instalado corretamente

Ótimo! Agora você está pronto para girar as rodas do Azure ML usando sua linguagem de programação preferida: R!


Conclusões

Após um longo período em que a Microsoft se concentrou exclusivamente no Python SDK para permitir que os cientistas de dados se beneficiassem dos serviços de computação e armazenamento do Azure, eles lançaram recentemente o R SDK também. Este artigo se concentra nas etapas necessárias para instalar o SDK do Azure Machine Learning R no seu ambiente preferido.

Os próximos artigos abordarão os principais recursos do R SDK.

var vglnk = {key: ‘949efb41171ac6ec1bf7f206d57e90b8’};

(função (d, t) {
var s = d.createElement
s.src = ‘//cdn.viglink.com/api/vglnk.js’;
var r = d.getElementsByTagName
} (documento, ‘script’));

Para Deixe um comentário para o autor, siga o link e comente no blog: R-posts.com.

R-bloggers.com oferece atualizações diárias por email sobre notícias e tutoriais do R sobre o aprendizado do R e muitos outros tópicos. Clique aqui se você deseja publicar ou encontrar um emprego em ciência da dados / R.


Deseja compartilhar seu conteúdo com R-blogueiros? clique aqui se você tiver um blog ou aqui se não tiver.



cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br