- Organizador: Daniel Lima Ribeiro (MP-RJ), [email protected]
- Professor: Dan S. Reznik (PUC-CCE), [email protected]
- Monitores
- Matheus Donato (ENCE/IBGE), [email protected]
- Thomás Jagoda (UFRJ), [email protected]
- Homepage: https://dan-reznik.github.io/MPRJ-Main/
- CPU i3 (6a geração ou melhor), RAM >= 4Gb, Windows10
- Tela: 14” (ou maior) e “full HD” (1920x1080). Evitar telas HD “puro” (720p)
- Exemplo: Samsung Essentials E30
- Instalar pacote
tidyverse
executando no cmd prompt:R -e "install.packages('tidyverse',repo='https://cloud.r-project.org')"
- GitHub
- Criar conta no GitHub
- Fork: https://github.com/dan-reznik/R-Ministerio-Publico-RJ
- RStudio, criar chaves SSH
git remote -v
git remote set-url origin [email protected]:user/repo_name.git
- Git, identificar usuário no cmd prompt:
git config --global user.email "<seu_mail>@<...>.com"
git config --global user.name "<seu nome>"
- Aula 1
- Slides introdutórios
- Colocamos alunos no GitHub, fork do repositório, clonagem
- Navegação no RStudio
- Comandos básicos de R no console
- Aula 2
- “refork” do projeto c/ delete, clonagem
- Comandos basicos do R num script .R
- Introdução a notebooks
- Criação de dataframes manualmente
- Leitura e exportação de dataframes com arquivos .csv
- Aula 3
- Rename remote:
git remote set-url origin https://github.com/dan-reznik/MPRJ-Main
- Atualizar o fork do projeto
git remote add upstream https://github.com/dan-reznik/MPRJ-Main && git fetch upstream && git checkout master && git merge upstream/master
- Nota: em caso de erro de merge,
git add . && git commit -m "fix merge" && git merge upstream/master
- “push” p/ seu fork pelo Rstudio
- Introdução ao “pipe”
%>%
- Os “verbos” do
dplyr
: select, filter, mutate, arrange, group_by, summarize - Cheatsheets
- Exercícios dplyr
- Rename remote:
- Aula 4
- Revisão: verbos do
dplyr
- Visualização com
ggplot2
, do livro do Kieran Healy, “Data Visualization” - Cheatsheet: Data Visualization
- Use
ggplot2
como Tableau com esquisse - Exercícios ggplot
- Revisão: verbos do
- Aula 5
- RMarkdown, cheatsheet
- Projeto:
- Escolher dataset aberto
- Propor questão de negócios + visualizações
- Criar página do projeto no github com README.Rmd
- Ingestão e preparo dos dados
- Aula 6
- Projeto
- Finalização
- Entrega / Apresentação
- Projeto
- Página principal
- Combina múltiplos CSVs num só dataframe: repo
- H. Wickham & G. Grolemund , “R for Data Science” (r4ds)
- Kieran Healy, “Data Visualization”
- Claus Wilke, “Fundamentals of Data Visualization”
- Winston Chang, Graphics Cookbook, 2nd edition
- Garrett Grolemund, “Hands-on Programming with R”
- Claudia Engel, “Data Wrangling with R”
- Jenny Bryan, Happy Git and GitHub for the useR"
- Yihui Xie et al., “Blogdown: Creating Websites with R Markdown”
- Max Kuhn, “Applied Predictive Modeling”
- Max Kuhn, “Feature Engineering and Selection: A Practical Approach for Predictive Models”
- Mark Sellors, “Field Guide to the R Ecosystem”
- Hadley Wickham, “Whole Game”
- David Robinson, “Tidytuesdays”
- Ben Stenhaug, “Tidyverse Tutorial Playlist”
- Tidyverse
- Visualização
- Markdown
- Pacotes R
- Blogs
- R-Bloggers
- Hadley Wickham, “Como se tornar um Cientista de Dados”
- Version Control
- Abhishek Joshi, “Tutorial Git”
- Rstudio & Git
- Karl Broman, “Github tutorial”
- Michael Freedman, “Git Collaboration”