Este repositório contém o código-fonte e materiais relacionados ao estudo "Aplicação de Aprendizado de Máquina no Auxílio ao Diagnóstico de Doenças Renais Crônicas", cujo objetivo é comparar diferentes algoritmos de aprendizado supervisionado para identificar casos de Doença Renal Crônica (CKD) a partir de dados clínicos.
O projeto tem como meta analisar e comparar o desempenho de quatro algoritmos de classificação para prever a presença de CKD, contribuindo para a detecção precoce e suporte à decisão clínica.
- K-Nearest Neighbors (KNN)
- Decision Tree (DT)
- Random Forest (RF)
- Fuzzy Unordered Rule Induction Algorithm (FURIA)
ℹ️ Os dados de desempenho e as regras fuzzy do algoritmo FURIA foram extraídos com suporte da ferramenta WEKA, utilizada para execução e análise do modelo.
O conjunto de dados utilizado foi o Chronic Kidney Disease Dataset disponível no UCI Machine Learning Repository.
- Instâncias: 400
- Atributos: 24 (clínicos e laboratoriais)
- Classes: CKD e NotCKD
- Desbalanceamento: ~62,5% CKD e 37,5% NotCKD
O pré-processamento incluiu:
- Tratamento de valores ausentes: imputação por média (atributos numéricos) e moda (atributos categóricos).
- Codificação de variáveis categóricas:
Label Encoding
. - Normalização:
Min-Max Scaling
. - Divisão treino/teste: 80/20, estratificada.
Para cada algoritmo, foram calculadas:
- Acurácia
- Precisão
- Recall
- F1-Score
- Matriz de Confusão