Chegando à pergunta certa

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br


[Esteartigofoipublicadopelaprimeiravezem[Thisarticlewasfirstpublishedon Blog do RStudio, e gentilmente contribuiu para os R-blogueiros]. (Você pode relatar um problema sobre o conteúdo desta página aqui)


Deseja compartilhar seu conteúdo com R-blogueiros? clique aqui se você tiver um blog ou aqui se não tiver.

O principal problema: nem todos falamos o mesmo idioma

As organizações do mundo empresarial moderno reconhecem a importância crítica da ciência de dados para obter vantagens competitivas. Esse reconhecimento levou a Glassdoor a classificar a Data Scientist como um dos 25 empregos mais bem pagos nos Estados Unidos em 2020.

No entanto, muitas organizações lutam para colocar o conhecimento desses cientistas de dados para trabalhar em seus negócios, onde eles podem realmente ter um impacto no sucesso. Ouvimos os cientistas de dados dizerem: “Os negócios não podem realmente nos dizer o que querem, portanto perdem muito do nosso tempo”. E, em troca, as pessoas de negócios costumam dizer: “Nossos cientistas de dados são realmente inteligentes, mas os aplicativos que eles criam com frequência ficam aquém do que procuramos”.

O problema aqui é que cientistas de dados e empresários falam idiomas muito diferentes. Especificamente, eles lutam para entender um ao outro:

  • dados. Quando uma pessoa de negócios pensa nos dados associados à empresa, geralmente pensa nos dados que pode ver em páginas da Web ou planilhas. Os cientistas de dados, por outro lado, geralmente procuram dados que possam acessar usando uma Interface de Programação de Aplicativo ou API.
  • processo. Quando os empresários pensam sobre o processo de análise, eles tendem a pensar em termos centrados nas pessoas, nos moldes de “Becky aceita o pedido e depois transmite esses dados para George”. Os cientistas de dados, por outro lado, geralmente pensam no processo como uma série de programas automatizados que funcionam sem pessoas.
  • resultados. Os cientistas de dados pensam em um resultado como uma análise executando e produzindo resultados corretos. Os empresários veem um resultado como algo que afeta as métricas (geralmente financeiras) da organização. Isso raramente é a mesma coisa, pelo menos na primeira versão de um projeto de ciência de dados.
Leia Também  A Premier Machine Learning Conference (código de desconto de 15%)

Ambos os pontos de vista são válidos – eles não são os mesmos, o que cria uma lacuna de comunicação.

Desenvolvimento iterativo pode superar a lacuna de comunicação

“Uma resposta aproximada à pergunta certa vale muito mais do que uma resposta precisa à pergunta errada”. –John Tukey

Aymen Waqar, de Astellas, discute a lacuna de comunicação de análise:

Essas lacunas de comunicação fazem parte de um desafio maior de definir (e refinar) o problema. Embora sua parte interessada na empresa possa acreditar que possui uma definição clara do problema que está tentando resolver, ela pode não entender se os dados estão disponíveis, quão complexa a modelagem pode ser ou quanto tempo a construção de um modelo em grandes dados pode levar ou o que problemas adjacentes podem ser potencialmente mais valiosos e / ou muito mais simples de resolver. Portanto, antes de iniciar o processo de desenvolvimento, o cientista de dados e as partes interessadas nos negócios devem explorar e discutir o problema com detalhes suficientes para criar um plano de desenvolvimento realista. E, embora os cientistas de dados e os empresários possam ter dificuldade para entender as palavras um do outro, eles geralmente podem concordar se conseguem apenas ver um modelo de trabalho. A parte difícil é chegar a esse modelo de trabalho.

Um processo de exploração de dados comumente usado pode ajudar

Uma maneira de chegar a um acordo é dividir o projeto em partes mais simples e obter um acordo sobre cada peça antes de passar para a próxima. Garrett Grolemund e Hadley Wickham propõem o seguinte processo abaixo em seu livro R para Ciência de Dados. Esse processo não é específico para nenhuma tecnologia como R ou Python. É uma maneira de fazer com que seu cientista de dados e patrocinador comercial cheguem a um consenso sobre qual pergunta eles estão atacando.

Leia Também  A pesquisa da Travelex revela "24% imóveis" de consumidores que se recusam a ficar sem dinheiro
cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br

Uma visualização do processo de ciência de dados

Os quatro passos são

  1. Importar. Identifique os dados que planeja usar e concentre-se primeiro na importação desses dados para poder trabalhar com eles.
  2. Arrumado. Agora que você tem os dados em mãos, reformule e manipule os dados de forma que suas ferramentas de análise possam trabalhar facilmente.
  3. Compreendo. Essa etapa é onde seus cientistas de dados devem interagir mais com os patrocinadores, transformando os dados em visuais e modelos e obtendo feedback sobre se eles satisfazem as necessidades da empresa.
  4. Comunicar. Depois de ter consenso sobre o que está construindo, é aqui que você simplifica e aprimora o resultado para que todos entendam o resultado.

Quatro recomendações para aplicar este processo

Muitos cientistas de dados (ou pelo menos aqueles que leram R para Ciência de Dados) use esse tipo de processo para fazer a análise. No entanto, poucos pensam em usá-lo como uma ferramenta de comunicação para garantir que estejam respondendo às perguntas comerciais adequadas. Você pode ajudar seus cientistas de dados a aplicar essa abordagem; incentive-os a:

  • Programe check-ins em cada etapa. Antes de começar, faça check-ins regulares com os patrocinadores da sua empresa. Idealmente, elas devem corresponder aproximadamente às fases de desenvolvimento listadas acima para garantir que todos estejam sincronizados antes de passar para a próxima fase.
  • Use ferramentas e idiomas de prototipagem rápida. R e Python são as ferramentas de escolha para a maioria dos cientistas de dados, porque são adequadas ao tipo de processo de desenvolvimento iterativo descrito aqui. Ambos os idiomas aceleram o desenvolvimento e possuem excelentes ferramentas de visualização que ajudarão a gerar consenso.
  • Documente o progresso usando documentos públicos. Use um único arquivo do Google Docs para gravar cada reunião e tomar decisões. Não inicie um novo documento com cada reunião, mas simplesmente anexe a data e as notas da reunião mais recentes na parte superior. Quando o projeto estiver concluído, você terá um registro de todo o processo do início ao fim, o que ajudará a planejar projetos futuros.
  • Adie as preocupações de desempenho até que você tenha um resultado acordado. Muitos projetos ficam atolados no design para implantação em larga escala antes que eles realmente saibam o que estão construindo. Em vez disso, desenvolva um protótipo que todos concordem ser a ideia certa e revise-o para aumentar quando você decidir colocá-lo em produção. Essa abordagem simplifica a tomada de decisões antecipada e não desperdiça tempo precioso do projeto em otimizações prematuras.
Leia Também  Travelex continua a fazer um bom progresso com sua recuperação de tecnologia

Depois que o aplicativo satisfizer seus cientistas de dados e partes interessadas nos negócios, convém compartilhar o aplicativo finalizado com a comunidade empresarial em geral. Uma das maneiras mais fáceis de fazer isso é através RStudio Connect, o que pode ajudá-lo a refinar rapidamente seu conteúdo durante a fase de criação de protótipos e compartilhá-lo de forma ampla e consistente na fase de produção. Falaremos mais sobre isso em nosso próximo post. Enquanto isso, para saber mais sobre como o Connect pode adicionar publicação por botão, execução agendada de relatórios e políticas de segurança flexíveis ao trabalho de ciência de dados da sua equipe, visite a página do produto RStudio Connect.



Se você chegou até aqui, por que não inscreva-se para atualizações do site? Escolha o seu sabor: o email, Twitter, RSS ou facebook …



cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br