Gere nomes usando probabilidades posteriores

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br


[Esteartigofoipublicadopelaprimeiravezem[Thisarticlewasfirstpublishedon R-posts.com, e gentilmente contribuiu para os R-blogueiros]. (Você pode relatar um problema sobre o conteúdo desta página aqui)


Deseja compartilhar seu conteúdo com R-blogueiros? clique aqui se você tiver um blog ou aqui se não tiver.

Se você estiver criando dados sintéticos e precisar gerar nomes de pessoas, este artigo será um guia útil. Este artigo faz parte de uma série de artigos sobre o pacote R conjurador. Você pode encontrar a primeira parte desta série aqui.

Etapas para gerar nomes de pessoas


1. Instalação


Instalar conjurador pacote usando o seguinte código.

 install.packages("conjurer") 

2. Dados de treinamento versus dados padrão


O pacote conjurador fornece 2 duas opções para gerar nomes.

    • A primeira opção é fornecer dados de treinamento personalizados.
    • A segunda opção é usar os dados de treinamento padrão fornecidos pelo pacote.

Se você deseja gerar nomes de pessoas, é melhor usar os dados de treinamento padrão. No entanto, se você deseja gerar nomes de itens ou produtos (exemplo: nomes de medicamentos), é recomendável que você crie seus próprios dados de treinamento.
A função que ajuda na geração de nomes é buildNames. Vamos entender as entradas da função. Esta função assume o formato conforme indicado abaixo.

buildNames(dframe, numOfNames, minLength, maxLength)

Nesta função,
dframe é um quadro de dados. Esse quadro de dados deve ser um quadro de dados de coluna única, em que cada linha contém um nome. Esses nomes devem conter apenas alfabetos em inglês (maiúsculas ou minúsculas) de A a Z, mas nenhum caractere especial como “;” ou caracteres não ASCII. Se você não passar esse argumento para a função, ela usará as probabilidades anteriores padrão para gerar os nomes.

Leia Também  O comércio pode explicar os casos da Covid -19?

numOfNames é um numérico. Isso especifica o número de nomes a serem gerados. Deve ser um número natural diferente de zero.

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br

minLength é um numérico. Isso especifica o número mínimo de alfabetos no nome. Deve ser um número natural diferente de zero.

comprimento máximo é um numérico. Isso especifica o número máximo de alfabetos no nome. Deve ser um número natural diferente de zero.

3. Exemplo


Vamos executar esta função com um exemplo para ver como ela funciona. Vamos usar a matriz padrão de probabilidades anteriores para este exemplo. A saída seria uma lista de nomes, conforme indicado abaixo.

library(conjurer)
peopleNames <- buildNames(numOfNames = 3, minLength = 5, maxLength = 7)
print(peopleNames)
[1] "ellie"   "bellann" "netar" 

Observe que, como este é um gerador aleatório, você pode obter outros nomes que não os exibidos no exemplo acima.

4. Código consolidado


A seguir, é apresentado o código consolidado para sua conveniência.

#install latest version
install.packages("conjurer") 

#invoke library
library(conjurer)

#generate names
peopleNames <- buildNames(numOfNames = 3, minLength = 5, maxLength = 7) 

#inspect the names generated
print(peopleNames) 

5. Observações finais


Neste artigo, aprendemos como usar o conjurador do pacote R e gerar nomes. Como o algoritmo se baseia em probabilidades anteriores, os nomes emitidos podem não se parecer exatamente com nomes humanos reais, mas soam foneticamente como nomes humanos. Então, vá em frente e tente. Se você gosta de entender o código subjacente que gera esses nomes, pode explorar o repositório do GitHub aqui. Se você estiver interessado no que virá a seguir neste pacote, pode encontrá-lo na seção de problemas aqui



Se você chegou até aqui, por que não inscreva-se para atualizações do site? Escolha seu sabor: e-mail, Twitter, RSS ou facebook ...

Leia Também  RvsPython # 2: girando dados do formato longo para o amplo



cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br