![]() |
---|
R Studio |
- RStudio: Ambiente integrado para desenvolvimento em R, oferecendo ferramentas para escrita, execução e depuração de código.
O objetivo deste mini-projeto é unir duas poderosas ferramentas de análise de dados para resolver um problema de negócio: Linguagem SQL será usada para análise exploratória de dados através do pacote sqldf e Linguagem R será usada para análise estatística.
Uma rede de hospitais gostaria de compreender as variáveis relacionadas aosgastoscom internações hospitalares de pacientes.Usaremos dados de uma pesquisa nacional de custos hospitalares realizada pela US Agency for Healthcare que consiste em registros hospitalares de amostras de pacientes internados. Os dados fornecidos são restritos à cidade de Wisconsin e referem-se a pacientes na faixa etária de 0 a 17 anos.
Vamos separar o trabalho em duas etapas. Na etapa 1 vamos explorar os dados usando Linguagem SQL e responder 10 perguntas de negócio. Na etapa 2 vamos realizar análise estatística com Linguagem R através do Teste ANOVA e Regressão Linear e responder 7 perguntas de negócio.
- Quantas raças estão representadas no dataset?
- Qual a idade média dos pacientes?
- Qual a moda da idade dos pacientes?
- Qual a variância da coluna idade?
- Qual o gasto total com internações hospitalares por idade?
- Qual idade gera o maior gasto total com internações hospitalares?
- Qual o gasto total com internações hospitalares por gênero?
- Qual a média de gasto com internações hospitalares por raça do paciente?
- Para pacientes acima de 10 anos, qual a média de gasto total com internações hospitalares?
- Considerando o item anterior, qual idade tem média de gastos superior a 3000?
- AGE: Idade do paciente
- FEMALE: Variável binária que indica se o paciente é do sexo feminino -LOS: (Length of stay) Tempo da internação do paciente
- RACE: Raça do paciente -TOTCHG: Custo da internação
- APRDRG: Grupo de diagnóstico refinado do paciente
Referências: Formação Cientista de dados (Data Science Academy: https://www.datascienceacademy.com.br)