Bem-vindo ao repositório do projeto que usa machine learning para prever complicações renais com alta precisão! Aqui, exploramos como Random Forest e SVM podem ajudar em diagnósticos médicos, evitando falsos negativos.
✅ Objetivo: Desenvolver um modelo confiável para identificar pacientes com risco de complicações renais.
✅ Dados: Características fisiológicas coletadas de um hospital ao longo de 2 meses.
✅ Resultados: Recall > 96% (quase nenhum caso positivo escapou!).
Práticas de machine learning foram utilizadas para preparar os dados e aplicar algoritmos de classficação para predição de DRC.
- Encoding dos dados categóricos
- Normalização dos dados
- Imputação de valores faltantes
- Separação em treino e teste
- Support Vector Machine
- Random Forest
- Stratified K-Fold para métricas confiáveis.
- Grid Search para otimizar hiperparâmetros.
- Matriz de confusão
- Métricas: recall, f1-score, acurácia
A base de dados poderia ser maior para melhor generalização.
-
Aplicar mais técnicas de pré processamento como feature selection.
-
Conseguir mais dados para o algoritmo
🔗 Vídeo explicativo do trabalho desenvolvido.
Scikit-learn: Documentação Oficial 📄
Artigo Classification of chronic kidney disease based on machine learning techniques
Dataset: Chronic Kidney Disease dataset
Para mais detalhes veja o notebook ou o artigo
Nome | github | |
---|---|---|
Alex Oliveira | 🐙🐱 @alekswheeler | aleks.vix@outlook.com |
Icaro Madalena | 🐙🐱 @bvl0 | icaro.nascimento@edu.ufes.br |
Feito com ❤️ e Python