GitHub - DamZav/knime-workflows-data-analysis-ml: Diabetes Risk Prediction Project with KNIME This project focuses on predicting the risk of developing type 2 diabetes using clinical and lifestyle variables. Built entirely in KNIME, it applies data cleaning, transformation, and supervised machine learning techniques to build a classification model. The workflow includes rule-based la

Predicción del Riesgo de Diabetes Tipo 2 — Proyecto de Certificación KNIME (BEDU)

El objetivo fue construir un modelo de clasificación para predecir el riesgo de desarrollar diabetes tipo 2 utilizando flujos de trabajo en KNIME Analytics Platform.

Objetivos del Proyecto:

Detectar de forma temprana a personas en riesgo de diabetes tipo 2.
Aplicar técnicas de aprendizaje automático supervisado (clasificación binaria).
Diseñar un flujo de trabajo completo en KNIME: limpieza, transformación, modelado y visualización.
Utilizar herramientas de evaluación para validar el rendimiento del modelo.

Descripción del Conjunto de Datos:

El dataset contiene variables clínicas, demográficas y de estilo de vida relevantes, como:

Edad, IMC, niveles de glucosa e insulina.
Actividad física, tabaquismo, hábitos dietéticos.
Salud pancreática, tolerancia a la glucosa.
Datos de embarazo y antecedentes familiares.

La variable objetivo riesgo_diabetes se generó mediante el nodo Rule Engine, considerando:

$niveles_glucosa$ ≥ 140 → 1 $tolerancia_glucosa$ = "Abnormal" → 1 Caso contrario → 0

Flujo de Trabajo Implementado en KNIME

Limpieza y Transformación
Column Rename (Regex): Normalización de nombres
Missing Value / Column Filter: Manejo de valores nulos y columnas irrelevantes
Normalizer: Escalado de variables numéricas.

Modelado

Partitioning (70/30): Estratificación por riesgo.
Tree Ensemble Learner (Random Forest): Modelo robusto para clasificación binaria
Tree Ensemble Predictor: Aplicación del modelo al set de prueba.

Evaluación y Visualización

Scorer: Evaluación del modelo (accuracy, recall).
Scatter Plot: IMC vs Niveles de Insulina.
Bar Chart: Comparación de variables clave según la predicción.

Resultados y Conclusiones

El modelo predijo correctamente la mayoría de los casos de riesgo.
Las variables con mayor impacto: niveles de glucosa, IMC, insulina y edad
Las visualizaciones reforzaron los hallazgos del modelo y facilitan la interpretación clínica.

Habilidades Desarrolladas

Flujo completo de Machine Learning en KNIME.
Clasificación supervisada (Tree Ensemble).
Transformación y limpieza de datos sin programación.
Evaluación de modelos y visualización efectiva.
Interpretación de resultados clínicos y presentación visual.

Herramientas Utilizadas

KNIME Analytics Platform

Componentes principales:

Rule Engine
Partitioning
Tree Ensemble Learner
Predictor
Scorer
Scatter Plot
Bar Chart
Normalizer

Este proyecto evidencia el uso práctico de KNIME para resolver problemas de clasificación médica, aplicando lógica clínica y flujos estructurados de aprendizaje automático sin escribir código.

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
KNIME Diabetes Prediction		KNIME Diabetes Prediction
LimpPrepData Workflow		LimpPrepData Workflow
Modelo de Clasificación IRIS Workflow		Modelo de Clasificación IRIS Workflow
Modelo de Regresión IRIS Workflow		Modelo de Regresión IRIS Workflow
Transformación y Normalizacion de Datos Workflow		Transformación y Normalizacion de Datos Workflow
tablasPrueba		tablasPrueba
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Predicción del Riesgo de Diabetes Tipo 2 — Proyecto de Certificación KNIME (BEDU)

About

Uh oh!

Releases

Packages

DamZav/knime-workflows-data-analysis-ml

Folders and files

Latest commit

History

Repository files navigation

Predicción del Riesgo de Diabetes Tipo 2 — Proyecto de Certificación KNIME (BEDU)

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Packages