Origem: https://www.kaggle.com/datasets/camnugent/california-housing-prices/data
Os dados provém de um censo do EUA de 1990, onde disponibiliza alguns dados sobre grupos de moradores da região e seus imóveis.
Clique aqui para ver o dicionário de dados da base utilizado.
Este projeto tem como objetivo construir e avaliar modelos de regressão para prever o valor médio de imóveis no estado da Califórnia, com base em dados demográficos e geográficos provenientes do censo dos EUA de 1990. Foram aplicadas técnicas de análise exploratória, engenharia de atributos, visualização geográfica e modelagem preditiva.
Para isso algumas etapas forma necessárias:
-
📊 EDA: análise exploratória e tratamento inicial dos dados.
-
🌍 GeoPandas & Folium: visualizações geográficas dos dados e agrupamento por localização.
-
🔢 Modelos de Regressão: aplicação e avaliação de modelos como Regressão Linear, Ridge, Lasso e ElasticNet.
-
📈 Polynomial Features: avaliação do impacto da transformação polinomial nas variáveis.
-
🧪 Regularização: comparação entre os modelos com técnicas de regularização.
-
🏁 Modelo Final: seleção do modelo com melhor desempenho e menor custo computacional (Ridge).
-
EDA: para tratamento e análise dos dados.
-
GeoPandas e Foium: para visualização e manipulação de dados geográficos.
-
Modelos de Regressão: testando modelos de regressão e preprocessamentos.
-
PolynomialFeatures: testando regressão polinomial.
-
Regularização: testando e comparando outros modelos e regularizações.
-
Modelo escolhido: modelo com melhor desempenho e menor penalização de processamento.
Uma versão interativa do projeto foi publicada via Streamlit. Acesse o app clicando abaixo:
👉 Acesse o App de Previsão de Preços
├── .gitignore <- Arquivos e diretórios a serem ignorados pelo Git
├── requirements.txt <- O arquivo de requisitos para reproduzir o ambiente de análise
├── LICENSE <- Licença de código aberto se uma for escolhida
├── README.md <- README principal para desenvolvedores que usam este projeto.
|
├── dados <- Arquivos de dados para o projeto.
|
├── modelos <- Modelos treinados e serializados, previsões de modelos ou resumos de modelos
|
├── notebooks <- Cadernos Jupyter. A convenção de nomenclatura é um número (para ordenação),
│ as iniciais do criador e uma descrição curta separada por `-`, por exemplo
│ `01-JN-exploracao-inicial-de-dados`.
│
| └──src <- Código-fonte para uso neste projeto.
| │
| ├── __init__.py <- Torna um módulo Python
| ├── config.py <- Configurações básicas do projeto
| └── graficos.py <- Scripts para criar visualizações exploratórias e orientadas a resultados
|
├── referencias <- Dicionários de dados, manuais e todos os outros materiais explicativos.
|
├── relatorios <- Análises geradas em HTML, PDF, LaTeX, etc.
│ └── imagens <- Gráficos e figuras gerados para serem usados em relatórios
-
Faça o clone do repositório que será criado a partir deste modelo.
git clone ENDERECO_DO_REPOSITORIO
-
Crie um ambiente virtual para o seu projeto utilizando o gerenciador de ambientes de sua preferência.
a. Caso esteja utilizando o
conda
, exporte as dependências do ambiente para o arquivoambiente.yml
:conda env export > ambiente.yml
b. Caso esteja utilizando outro gerenciador de ambientes, exporte as dependências para o arquivo
requirements.txt
ou outro formato de sua preferência. Adicione o arquivo ao controle de versão, removendo o arquivoambiente.yml
.
Este projeto está licenciado sob a Licença MIT - veja o arquivo LICENSE para detalhes.
Desenvolvido por José Nivaldo
Entre em contato: jnjunior96@outlook.com