uma abordagem computacional para a aprendizagem estatística [book review]

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br


[Esteartigofoipublicadopelaprimeiravezem[Thisarticlewasfirstpublishedon R – Og de Xian, e gentilmente contribuiu para os R-blogueiros]. (Você pode relatar um problema sobre o conteúdo desta página aqui)


Deseja compartilhar seu conteúdo com R-blogueiros? clique aqui se você tiver um blog ou aqui se não tiver.

To livro dele me foi enviado pela CRC Press para revisão no CHANCE. Eu li isso algumas manhãs enquanto [confined] em casa e achei muito mais computacional do que estatístico. No sentido de que os autores se aprofundam na construção de procedimentos de aprendizagem padrão, incluindo códigos R caseiros que obviamente ajudam a entender o âmago da questão desses procedimentos, o que eles chamam tente e conte, mas que o significado estatístico e a incerteza desses procedimentos permanecem pouco afetados pelo livro. Isso não é incomum na literatura de aprendizado de máquina, em que o erro de previsão nos dados de teste geralmente parece ser o objetivo final, mas isso não é tradicionalmente estatístico. Os autores apresentam seu trabalho como (um computacional?) Suplementar aos Elementos de Aprendizagem Estatística, embora eu ache difícil espremer os dois livros em um semestre ou dedicar dois semestres no tópico, especialmente no nível de graduação.

Cada capítulo inclui uma análise estendida de um conjunto de dados específico e este é um ativo do livro. Se às vezes for excessivo na venda do poder preditivo dos procedimentos. Roteiros impressos extensos em R podem ser cansativos a longo prazo, pelo menos para mim, mas isso pode ser simplesmente uma lacuna geracional! E os modelos de aprendizado são principalmente unidimensionais, veja, por exemplo, o capítulo sobre matrizes lineares com uma profusão de métodos. (Alguém poderia me explicar o ponto da Figura 4.9?) O capítulo sobre redes neurais tem uma introdução bastante intuitiva que deve alcançar novos leitores. Embora conhecer os dados manuscritos com dígitos tenha me feito voltar ao final dos anos 80, quando minha esposa estava trabalhando no reconhecimento automático de caracteres. Mas achei a visualização dos pesos de aprendizado para a classificação de personagens sugerindo sua forma (p.254) mais atraente!

Leia Também  Como planejadores financeiros planejam suas despesas de aposentadoria?
cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br

Entre as coisas que estou perdendo ao ler este livro, uma linha de vida sobre o significado de um modelo estatístico além da previsão, atenção à especificação incorreta, incerteza e variabilidade, especialmente quando estiver fora do alcance dos dados de aprendizagem e, principalmente, ao retornar resultados de regressão com estrelas de significância, discussões sobre as ferramentas de avaliação, como a distância usada na função objetivo (por exemplo, falta de invariância de escala ao adicionar erros nos coeficientes de regressão) ou multiplicação sem princípios de parâmetros de calibração, alguns assintóticos, pelo menos uma observação sobre a perda de informações devido à divisão dos dados em partes, fornecendo alguma substância (assintótica) ao usar “consistente”, aguardando uma única página 319 para ver os “problemas de qualidade dos dados” mencionados. Embora a metodologia seja defendida por argumentos algébricos e de cálculo, há muito pouco do lado da probabilidade, o que explica por que os autores consideram que os alunos precisam “estar familiarizados com os conceitos de expectativa, viés e variação”. E só isso. Alguns parágrafos da abordagem bayesiana estão fazendo mais mal do que bem, especialmente com tão pouco histórico em probabilidade e estatística.

O livro possivelmente contém a introdução mais incomum ao modelo linear que me lembro de ter lido: Coeficientes como derivativos … Seguidos de uma cobertura muito detalhada da inversão de matrizes e decomposição de valores singulares. (Não soaria como a prioridade número 1 se eu desse esse curso.)

O inevitável erro de digitação “the the” foi encontrado na página 37! Um erro de digitação menos comum foi a desigualdade de Jensen, escrita como “desigualdade de Jenson”. Tanto no texto (p.157) quanto no índice, seguido de uma repetição da mesma fórmula em (6.8) e (6.9). Um “obstinado” (p.179) que me fez procurar um tempo por esse verbo desconhecido. Outro erro de digitação na regressão do kernel Nadaraya-Watson, quando a largura de banda h de repente se transforma em n (e eu tive que verificar duas vezes por causa da minha falta de visão!). Um uso incomum da partição em que os conjuntos na partição são chamados de partições. Da mesma forma, o uso flutuante de pontos para produtos na dimensão um, incluindo uma forma de ⊗ para produto matricial (na equação (8.25)), seguido na próxima página pela notação para o produto Hadamard. Eu também suspeito que a matriz K em (8.68) está faltando 1s ou estou perdendo o ponto, pois K é o número de núcleos na próxima página, logo após uma foto da Torre Eiffel …) Um número surpreendente de referências para um livro de graduação , com autores às vezes citados com nome completo e às vezes citados com sobrenome. E relatórios técnicos que não pertencem a esse nível de livros. Deixe-me acrescentar a observação de pedante de que Conan Doyle escreveu mais romances “que não incluem seu personagem Sherlock Holmes” do que romances que incluem Sherlock.

Leia Também  Liberada a versão 0.9.1 do NIMBLE

[Disclaimer about potential self-plagiarism: this post or an edited version will eventually appear in my Books Review section in CHANCE. As appropriate for a book about Chance!]



Se você chegou até aqui, por que não inscreva-se para atualizações do site? Escolha seu sabor: e-mail, Twitter, RSS ou facebook …



cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br