Economia empírica com R (Parte A): a fórmula do vinho e o aprendizado de máquina

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br

[ad_1]

Neste semestre, eu ensino um novo curso: Economia Empírica com R. Todo o material está disponível online, incluindo vídeo-aulas com questionários e conjuntos de problemas interativos do RTutor, que talvez sejam a parte mais importante do curso.

Um objetivo ao projetar o curso era motivar a maioria dos conceitos com uma ou duas aplicações principais. A aplicação principal no capítulo 1 é baseada na pesquisa de Orley Ashenfelter e co-autores que desenvolveram com um pequeno conjunto de dados e uma regressão linear simples uma fórmula para a qualidade dos vinhos tintos de Bordeaux:

wine quality = 
    0.6160  * average temperature during growing season
  + 0.00117 * rainfall in preceeding winter months
  - 0.00386 * rainfall in August (harvest month)

Acho que esta aplicação demonstra muito bem uma abordagem à pesquisa econômica empírica que prevalecia mais nos dias anteriores. Alguém tem um pequeno conjunto de dados e deseja encontrar uma fórmula simples que descreva bem uma relação empírica estável no mundo real. Ou talvez seja apenas como eu pensava quando era um jovem estudante como a economia seria mais semelhante. Infelizmente, verifica-se que a economia é um campo que parece quase sempre vazio de relações empíricas simples e estáveis, pelo menos se tomarmos as leis naturais como referência. Ainda assim, você verá que o modelo de regressão simples para a fórmula do vinho tem um ajuste surpreendentemente bom na amostra. No entanto, a precisão da previsão fora da amostra é discutida apenas qualitativamente e menos clara.

A discussão da precisão de predição fora da amostra naturalmente nos leva ao capítulo 2, que mostra como contraste a abordagem moderna de aprendizado de máquina para problemas de predição. Estudamos um conjunto de dados razoavelmente grande de preços de casas e introduzimos a divisão da amostra em um conjunto de dados de treinamento e teste para avaliar sistematicamente a precisão da previsão fora da amostra. Também introduzimos árvores de regressão, florestas aleatórias e ajuste de parâmetro por meio de validação cruzada k-fold. O conjunto de problemas RTutor também cobre algumas estratégias para lidar com valores ausentes.

Leia Também  Enviando pacote R para CRAN
cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br

Os capítulos posteriores lidam com estratégias para estimar os efeitos causais e as aplicações correspondentes e serão resumidos em postagens futuras.

Você pode encontrar todo o material no repositório Github do curso. Dê uma olhada nas instruções de configuração se quiser resolver os conjuntos de problemas do RTutor em seu próprio computador.



[ad_2]

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br