Questo repository raccoglie cinque progetti di analisi avanzata su dati clinico-riabilitativi reali, con l’obiettivo di estrarre insight utili alla pianificazione sanitaria, ottimizzazione delle risorse e personalizzazione delle cure presso il Policlinico Italia.
. ├── 01_outcome_model/ # Predizione outcome riabilitativi (Barthel, FIM) ├── 02_degenza_analysis/ # Analisi predittiva della degenza prolungata ├── 03_patient_clustering/ # Clustering per pattern clinici ├── 04_riammissioni/ # Modello predittivo di riammissioni a 30/90 giorni ├── 05_trend_longitudinali/ # Analisi epidemiologica e trend pluriennali ├── results/ # Report e grafici generati └── README.md # Questo file
- 
Predizione di outcome riabilitativi Obiettivo: Predire punteggio Barthel, delta Barthel. Tecniche: Regressione XGBoost, SHAP per interpretabilità. Impatto: Supporto alla pianificazione dei percorsi e confronti tra centri o team clinici. 
- 
Analisi dei tempi di degenza Obiettivo: Identificare fattori clinici e sociodemografici associati a ricoveri lunghi. Tecniche: Classificazione binaria (degenza ≥ 30gg), SHAP. Impatto: Ottimizzazione delle risorse, riduzione costi e miglioramento dell'efficienza. 
- 
Clustering per pattern clinici nascosti Obiettivo: Segmentare i pazienti in gruppi omogenei per stato clinico e traiettoria di cura. Tecniche: KMeans, PCA, silhouette analysis, profiling con grafici radar. Impatto: Personalizzazione della riabilitazione, miglioramento comunicazione medico-paziente. 👉 Estensione: Abbiamo incluso un modulo di Cluster Profiling che consente di: -Identificare i profili clinici prevalenti in ciascun cluster. -Visualizzare le variabili discriminanti per ogni gruppo. -Integrare le informazioni in modelli predittivi o dashboard interattiv 
- 
Modello predittivo di riammissioni ospedaliere Obiettivo: Prevedere il rischio di riammissione a 30/90 giorni. Tecniche: Classificatori supervisati, analisi SHAP, bilanciamento classi. Impatto: Prevenzione secondaria, follow-up mirati, riduzione dei rientri in reparto. (Dato non sufficiente) 
- 
Trend longitudinali e analisi epidemiologiche Obiettivo: Monitorare l’evoluzione nel tempo di indicatori clinici e demografici. Tecniche: Analisi descrittiva + report automatico in PDF (generate_trend_report.py) Grafici inclusi: Pazienti unici per anno, Età media e percentuale grandi anziani, Barthel medio all’ingresso, Diagnosi prevalenti nel tempo Impatto: Supporto a decisioni strategiche e politiche sanitarie. 
- 
Clona il repository git clone https://github.com/DanteTrb/rehab-intelligence.git cd rehab-intelligence 
- 
Crea ambiente virtuale python -m venv .venv source .venv/bin/activate # su Mac/Linux oppure .venv\Scripts\activate.bat # su Windows 
- 
Installa i requisiti pip install -r requirements.txt 
- 
Esegui uno dei notebook Apri il file Jupyter corrispondente al progetto che ti interessa (01_outcome_model/..., ecc.) 
- 
Genera PDF finale dei trend epidemiologici (opzionale) python generate_trend_report.py 
Python (pandas, scikit-learn, matplotlib, seaborn, fpdf) SHAP, clustering unsupervised Export in PDF per report automatizzati Dataset originale in formato .parquet
Accuratezza modelli > 80% nei task predittivi Insight clinicamente interpretabili via SHAP Riduzione significativa delle feature inutili grazie a filter/wrapper selection Cluster clinici coerenti con tipologie reali di pazienti
Progetto sviluppato da Dante Trabassi e Stefano Filippo Castiglia
Per Settembre