[ad_1]
Deseja compartilhar seu conteúdo com R-blogueiros? clique aqui se você tiver um blog ou aqui se não tiver.
Selenium é uma biblioteca poderosa disponível para Python e R (a versão R é chamada RSelenium
), que pode automatizar tarefas como preenchimento de formulários, aplicativos de trabalho, administração do sistema CRM e muitas outras tarefas. Dito isto, o Selenium também pode ser usado para causar muitos danos, como preencher formulários com respostas falsas, fazer bots para criar visualizações falsas para o YouTube e outros fins nefastos.
Com isso em mente, só consigo pensar no que Peter Parker disse ao tio Ben:

Esta postagem do blog é sobre como foi a configuração do Selenium no R e Python para mim. Se você pode se relacionar com isso ou tiver alguma ideia, deixe um comentário abaixo!
Aprender a usar o Selenium no Python levou cerca de 10 minutos para descobrir. Tudo o que eu precisava fazer era baixar o chromedriver e instalar o selênio pip install selenium
e eu estava pronto para começar a trabalhar com isso.
Eu até consegui fazer alguma automação de formulários com ele:

A partir da documentação oficial, o RSelenium é recomendado para ser executado no Docker.

Vindo do Python e desejando fazer isso no R, isso me incomodou, pois minha máquina principal não suporta virtualização – o que me desqualifica de poder instalar o Docker na máquina em que estou trabalhando.
Isso me deixou sem outra opção senão usar o Selenium estritamente em Python.
Enquanto o Chromedriver recomenda que seja executado em uma VM, não é um requisito, e eu pude usá-lo no Python. Minha experiência com o RSelenium é que é impossível usá-lo sem o Docker ou algo semelhante, o que é decepcionante, pois eu queria ver como RSelenium
assemelham-se.
Se você realmente deseja usar o Selenium em uma estrutura R (talvez porque precise fazer uma disputa de dados ou queira usar tidyverse
como parte do seu projeto etc.), eu recomendaria escrever o script em python e executá-lo em R com o comando reticulate
pacote e tem algo como:
reticulate::py_run_file("path_to_python_file") ... ... (Rest of your R Code)
Deixe-me reiterar que você pode aprender a usar o Selenium no Python em cerca de 10 minutos, portanto a curva de aprendizado é tão difícil quanto encontrar uma solução para RSelenium
e integrará no código R graças à reticulate
pacote.
Então, como as coisas parecem agora – a menos que as coisas mudem, meu trabalho no Selenium terá que ser escrito em Python.
Esta postagem originalmente seria uma onde eu compararia o uso e a velocidade do Selenium no R e Python, mas a incapacidade de instalar o Docker no meu computador me impediu de usar o RSelenium
pacote.
Tenho certeza de que não sou o único que enfrentou esse desafio, então pensei em compartilhar meus pensamentos sobre como contorná-lo.
Se você tiver uma solução melhor, sinta-se à vontade para compartilhá-la comigo, pois eu gostaria de fazer uma comparação entre Python e R usando o Selenium!
Relacionado
[ad_2]