AdaOpt (um classificador probabilístico baseado em uma combinação de otimização multivariável e vizinhos mais próximos) para R

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br


Na semana passada, neste blog, apresentei AdaOpt para Python em um classificação de dígitos manuscritos tarefa. AdaOpt é uma novela probabilístico classificador, baseado em uma combinação de otimização multivariável e vizinhos mais próximos algoritmo. Ainda é muito novo e só o tempo permitirá apreciar plenamente todos os seus recursos.

A ferramenta é rápida devido ao Cython e ao onipresente (e poderoso) numpy, que ajuda a trazer ao Python performances do tipo C / C ++. Existem também alguns truques disponível em AdaOpt, que permitem acelerar o treinamento Maior conjuntos de dados. Mais detalhes sobre o algoritmo podem ser encontrados neste documento (curto).

imagem-título-aqui

AdaOpt é agora disponível para usuários Re usei o reticulate para portá-lo (como fiz para o molho de nnetsauce). Uma documentação R para o pacote pode ser encontrada neste repositório.

Aqui está um exemplo de uso:

1 – Instalar pacotes

AdaOptO código de desenvolvimento está disponível no GitHub, e o pacote pode ser instalado usando devtools no console do R:

library(devtools)
devtools::install_github("thierrymoudiki/mlsauce/R-package/")
library(mlsauce)

O pacote datasets também é usado para treinar o modelo:

library(datasets)

2 – Conjunto de dados para classificação

o iris conjunto de dados (do pacote datasets) é usado para esta demonstração simples:

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br
# import iris dataset

X 

3 – Modelo de ajuste e pontuação no conjunto de teste

Agora, criamos um AdaOptobjeto e imprima seus atributos:

# create AdaOpt object with default parameters
obj 
## $batch_size
## [1] 100
## 
## $cache
## [1] TRUE
## 
## $eta
## [1] 0.01
## 
## $gamma
## [1] 0.01
## 
## $k
## [1] 3
## 
## $learning_rate
## [1] 0.3
## 
## $n_clusters
## [1] 0
## 
## $n_iterations
## [1] 50
## 
## $reg_alpha
## [1] 0.5
## 
## $reg_lambda
## [1] 0.1
## 
## $row_sample
## [1] 1
## 
## $seed
## [1] 123
## 
## $tolerance
## [1] 0
## 
## $type_dist
## [1] "euclidean-f"

Modelo apropriado:

# fit AdaOpt to iris dataset
obj$fit(X_train, y_train)
## AdaOpt(batch_size=100, cache=True, eta=0.01, gamma=0.01, k=3, learning_rate=0.3,
##        n_clusters=0.0, n_iterations=50, reg_alpha=0.5, reg_lambda=0.1,
##        row_sample=1.0, seed=123, tolerance=0.0, type_dist="euclidean-f")

Obtivermos precisão do conjunto de teste:

# accuracy on test set 
print(obj$score(X_test, y_test))

Por fim, não, este pacote não vai acabar no CRAN. Nenhum dos meus pacotes será, a partir de agora. Se você planeja enviar seu pacote para este site, bem, há mais do que se orgulhar de aceitá-lo. Se eu puder: pense por mais tempo. Em particular: leia este documento sobre opções de licenças e conheça seus direitos sobre seu propriedade intelectual…

Leia Também  4 dicas para economizar dinheiro ao pagar dívidas

Nota: Atualmente, estou procurando um show. Você pode me contratar no Malt ou me enviar um email: thierry dot moudiki às pm me dot. Eu posso fazer estatísticas descritivas, preparação de dados, engenharia de recursos, calibração de modelos, treinamento e validação e interpretação de resultados de modelos. Sou fluente em Python, R, SQL, Microsoft Excel, Visual Basic (entre outros) e francês. Meu resumo? Aqui!



Se você chegou até aqui, por que não inscreva-se para atualizações do site? Escolha o seu sabor: e-mail, twitter, RSS ou facebook …



cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br