Este repositório concentra os meus estudos e experimentos de implementação em Python para ajudar a consolidar os aprendizados relacionados aos fundamentos da estatística.
Abaixo eu listo alguns materiais (palestras, livros, ...) que me inspiraram a criar este repositório (listados na ordem em que tive acesso aos mesmos):
(Palestra) John Rauser keynote: "Statistics Without the Agonizing Pain" -- Strata + Hadoop 2014 (Fonte: https://www.youtube.com/watch?v=5Dnw46eC-0o)
(Palestra) Statistical Thinking for Data Science | SciPy 2015 | Chris Fonnesbeck (Fonte: https://www.youtube.com/watch?v=TGGGDpb04Yc)
(Livro) Efron, B., & Hastie, T. (2016). Computer Age Statistical Inference: Algorithms, Evidence, and Data Science. Cambridge: Cambridge University Press. (Fonte: https://web.stanford.edu/~hastie/CASI/)
A palestra do John Rauser (no momento da escrita deste texto, cientista de dados e engenheiro de software na Snapchat) me inspirou a, sempre que possível, buscar a explicação intuitiva por trás dos procedimentos estatísticos utilizados.
A palestra do Christopher Fonnesbeck (professor de bioestatística da universidade de Vanderbilt e um dos criadores do PyMC3), por mais óbvio que pareça, me inspirou a querer buscar o entendimento a respeito da estatística e da matemática por trás dos algoritmos que constumamos utilizar como cientista de dados.
Finalmente, o livro do Bradley Efron (professor de estatística de Stanford e criador da técnica de amostragem bootstrap) e do Trevor Hastie (professor de estatística de Stanford e um dos co-autores do famoso livro Elements of Statistical Learning) -- que estou estudando aos poucos -- apresentou-me um ponto de vista interessante sobre a estatística, no qual, a análise estatística, de maneira geral, tem duas componentes operacionais: a componente algorítmica e a componente da inferência ...
Very broadly speaking, algorithms are what statisticians do while inference says why they do them. A particularly energetic brand of the statistical enterprise has flourished in the new century, data science, emphasizing algorithmic thinking rather than its inferential justification. (Fonte: Efron, B., & Hastie, T. (2016). Computer Age Statistical Inference: Algorithms, Evidence, and Data Science. Cambridge: Cambridge University Press.)
sendo que, na minha opinião, o conhecimento sobre a parte "... its inferential justification" é muito importante, melhor dizendo fundamental, para qualquer cientista de dados.