Quando trabalhamos com dados tidy (arrumados), podemos utilizar as mesmas ferramentas, de formas similares, em bases de dados diferentes…
… porém, quando trabalhamos com bases de dados untidy (desarrumadas), muitas vezes precisamos reinventar a roda: desenvolvemos uma solução que muitas vezes é difícil de iterar ou reutilizar.
– (tradução livre, thanks to Beatriz Milz)
-
Clique aqui para baixar o material do curso.
-
Os pacotes necessários no curso e o código para instalação estão disponíveis neste link.
-
Nosso livro Ciência de Dados em R: https://livro.curso-r.com/
-
Nosso blog: https://curso-r.com/blog/
Fora do horário de aula ou monitoria:
-
perguntas gerais sobre o curso deverão ser feitas no Classroom.
-
perguntas sobre R, principalmente as que envolverem código, deverão ser enviadas no nosso fórum.
slide | link | |
---|---|---|
slides/01-introducao-ao-curso.html | https://curso-r.github.io/main-faxina/slides/01-introducao-ao-curso.html | https://curso-r.github.io/main-faxina/slides/01-introducao-ao-curso.pdf |
slides/02-introducao-faxina.html | https://curso-r.github.io/main-faxina/slides/02-introducao-faxina.html | https://curso-r.github.io/main-faxina/slides/02-introducao-faxina.pdf |
slides/03-integracao.html | https://curso-r.github.io/main-faxina/slides/03-integracao.html | https://curso-r.github.io/main-faxina/slides/03-integracao.pdf |
Aqui colocamos scripts utilizados em aula que são novos ou que são versões modificadas do material básico da aula.
nome | link |
---|---|
exercicios/01-exercicio.R | https://curso-r.github.io/main-faxina/exercicios/01-exercicio.R |
exercicios/02-exercicio.R | https://curso-r.github.io/main-faxina/exercicios/02-exercicio.R |
exercicios/03-exercicio.R | https://curso-r.github.io/main-faxina/exercicios/03-exercicio.R |
O trabalho final consiste em construir um projeto em R que utiliza os conceitos que aprendemos no curso, partindo de uma base de dados untidy como entrada e apresentando um (ou mais) scripts que a entrada em uma base tidy.
Com o objetivo de tornar o trabalho mais divertido e útil para a comunidade, de preferência, use uma base de dados que esteja pública (que possa ser acessada por qualquer pessoa, sem restrição). Você pode, por exemplo, escolher uma fonte de dados que você tem interesse em trabalhar. Se não tiver ideia do que escolher, seguem algumas sugestões:
- Algum dos microdados do IDEB
- Dados de ocupação hospitalar
- Alguma das bases disponíveis na SSP que não tenham sido trabalhadas no curso.
O que devo entregar?
Uma pasta contendo três itens:
-
A base de dados em formato bruto OU um script de acesso a essa base, fazendo um download por exemplo. Esse segundo caso só deve ser usado caso a base que você pretenda utilizar ultrapasse 50 MB. Caso você queira usar uma base maior, pedimos que ela 1 GB.
-
Um ou mais scripts R que transformem a sua base bruta e untidy em uma (ou mais) base(s) tidy. O(s) seu(s) script(s) deve(m) necessariamente:
- Ler os dados brutos;
- Manipular uma coluna do tipo texto;
- Salvar uma base de dados ao final do script que esteja no
formato tidy “aumentado” que apresentamos no começo do curso, no
formato
.rds
.
-
Um arquivo Rmarkdown (.Rmd) contendo uma descrição do que foi feito e uma análise simples da base tidy (por exemplo, um gráfico). Não faça a leitura dos arquivos brutos nesse documento.
- Obs: Se você não se sentir confortável com o formato
RMarkdown
, pode mandar um arquivo.docx
(editado no Microsoft Word), um arquivo.txt
, ou comentários (bem detalhados) nos script(s).R
enviado(s).
- Obs: Se você não se sentir confortável com o formato
O que é importante conter na descrição do que foi feito?
- Uma introdução, que consiste num texto descrevendo o que o seu código fará, respondendo no mínimo três perguntas: Por que a base pode ser considerada untidy? Como você organizou os seus arquivos pra transforma-la em uma base tidy? Que tipo de análise a sua base tidy possibilita?
A entrega pode ser feita anexando a pasta .zip
, ou então enviando um
link da pasta no Google Drive (atenção: permita que qualquer pessoa
possa ler os arquivos).
As pessoas que fizerem os três trabalhos mais legais receberão bolsas da Curso-R!
Observação: Caso você entregue o trabalho, entendemos que concorda em apresentar um link para o seu trabalho na página do curso. Caso você não se sinta confortável com essa possibilidade, pedimos que nos avise no momento da entrega através dos comentários.
A data limite de entrega é 24/06/2021, às 23:59. Os resultados serão avaliados até o dia 25/07/2021.
(em breve)
Referências extras comentadas nas aulas.
Instagram: https://www.instagram.com/cursoo_r/
Twitter: https://twitter.com/curso_r
Youtube: https://www.youtube.com/c/CursoR6/featured
Linkedin: https://www.linkedin.com/company/curso-r/
Facebook: https://www.facebook.com/cursodeR