Aula 1 do curso de atualização "Introdução à aprendizagem estatística e à ciência de dados em R"
O conteúdo do curso corresponde aos seguintes tópicos:
1 - Revisão de conceitos básicos de probabilidade e estatística: variáveis aleatórias, esperança, variância, e viés. Estimadores pontuais e por intervalo. Métodos de reamostragem e bootstrap.
2 - Introdução à linguagem de programação R e noções básicas de simulação.
3 - Introdução ao aprendizado estatístico supervisionado.
4 - Modelos lineares para regressão e classificação. Métodos de regularização e seleção de variáveis para modelos lineares: LASSO, Ridge, BIC.
5 - Avaliação e seleção de modelos.
6 - Regressão logística, redes neurais e deep learning.
7 - Métodos bagging, florestas aleatórias e boosting.
8 - Algoritmos para estimação e implementações no R.
Bibliografia:
1. G. James, D. Witten, T. Hastie & R. Tibshirani. An Introduction to Statistical Learning with Applications in R. Springer, 2013.
2. T. Hastie, R. Tibshirani & J. Friedman. The Elements of Statistical Learning. 2nd edition. Springer, 2009.
3. Y. Abu-Mostafa, M. Magdon-Ismail & H.T Lin. Learning from Data. AMLBook, 2012.
4. B. Efron & J. Friedman. Computer Age Statistical Inference. Cambridge University Press, 2016.
5. T. Hastie, R. Tibshirani & M. Wainwright. Statistical Learning with Sparsity. The Lasso and Generalizations. CRC Press, 2015.
6. I. Goodfellow, Y. Bengio & A. Courville. Deep Learning. MIT Press. 2016
Oferecer para a comunidade externa à Universidade de São Paulo um curso de fundamentos teóricos em aprendizagem estatística e ciência de dados e também um treinamento prático usando a linguagem R, considerando a grande demanda atual dos profissionais que atuam no mercado de trabalho por este tipo de conhecimentos/ferramentas. Aproximar os temas de pesquisa desenvolvidos na Universidade para a comunidade externa, proporcionando uma ponte entre a Academia e a comunidade em geral.