Bienvenidos al repositorio de la materia Análisis de Datos! Aquí encontrarán los materiales de clase, notebooks, datasets y recursos adicionales.
notebooks/
→ Contiene las notebooks con los ejemplos y ejercicios de cada clase.datasets/
→ Conjunto de datos utilizados en los ejemplos y prácticas.recursos/
→ Ejericios, reportes y otros materiales útiles.scripts/
→ One-offs / no reutilizable.utils/
→ Funciones auxiliares utilizadas en las notebooks.
⚠️ Recordá que las diapositivas de las clases y los enunciados de los TPs se encuentran en el Campus posgrado de la FIUBA.
🎓 ¿Sos alumno de una cohorte anterior? Encontrá aquí las instrucciones para descargar los contenidos correspondientes a tu curso y bimestre.
Clase | Tema | Notebooks |
1️⃣ | Introducción al Análisis de Datos | notebook_clase_1 |
2️⃣ | Análisis exploratorio de datos (EDA) | notebook_clase_2 |
3️⃣ | EDA (cont.) y preprocesamiento | notebook_clase_3_outliers |
notebook_clase_3_datos_faltantes | ||
4️⃣ | Preprocesamiento (cont.) y Feature Engineering | notebook_clase_4_codificación |
notebook_clase_4_normalización_estandarización | ||
notebook_clase_4_discretización | ||
notebook_clase_4_desbalance | ||
5️⃣ | Taller práctico - parte 1 | A ser agregada |
6️⃣ | Pruebas estadísticas y reducción de la dimensionalidad | A ser agregada |
7️⃣ | Taller práctico - parte 2 | A ser agregada |
8️⃣ | Automatización del análisis de datos | A ser agregada |
📚 Bibliografía recomendada aquí.
-
Entrega del TP parte 1: Lunes 2 de junio de 2025 (hasta las 23:59 hora de Argentina).
-
Entrega del TP parte 2: Lunes 16 de junio de 2025 (hasta las 23:59 hora de Argentina).
-
Última clase: Jueves 19 de junio de 2025.
En esta sección se explican los pasos para utilizar este repositorio.
- Anaconda o miniconda
- Git
git clone https://github.com/FIUBA-Posgrado-Inteligencia-Artificial/CEIA_Analisis_de_datos.git
cd CEIA_Analisis_de_datos
conda env create -f environment.yml
conda activate add-env
jupyter notebook
Este proyecto también permite usar Poetry para manejo de dependencias. Seguir los pasos detallados a continuación para crear un environment a partir de los archivos pyproject.toml
y poetry.lock
proporcionados.
- Poetry : Instrucciones de instalación
- Python 3.11 o 3.12
- Git
git clone https://github.com/FIUBA-Posgrado-Inteligencia-Artificial/CEIA_Analisis_de_datos.git
cd CEIA_Analisis_de_datos
- macOS/Linux
poetry env use python3.11
- Windows
poetry env use "py -3.11"
poetry install --no-root
Nota: --no-root evita la instalación como package que no es necesaria aquí.
poetry env list
Este comando devuelve todos los environments asociados al proyecto (verificar que
ceia-analisis-de-datos-xxxxxxx-py3.11
aparece en la lista)
poetry env info
Este comando muestra detalles tales como la versión de Python y el path (ej.,
/Users/<username>/Library/Caches/pypoetry/virtualenvs/...
en macOS oC:\Users\<username>\AppData\Local\pypoetry\...
en Windows).
- macOS/Linux (zsh/bash):
eval "$(poetry env activate)"
- Windows (PowerShell/CMD):
Invoke-Expression (poetry env activate)
Después de ejecutar el comando, el nombre del environment debería aparecer en el prompt de la terminal entre paréntesis (ej.,
ceia-analisis-de-datos-py3.11
).
python --version
Debería mostrar Python 3.11.X o 3.12.X.
which python # macOS/Linux
where python # Windows
Debería apuntar al Pyhton del env. de Poetry (ej., /Users//.../bin/python o C:\Users<username>...\Scripts\python.exe).
poetry run python -m ipykernel install --user --name=ceia-analisis-de-datos --display-name "Python (CEIA)"
jupyter notebook
Una vez abierto Jupyter, ir a Kernel → Change Kernel y seleccionar "Python (CEIA)".
Al momento de la actualización de este repositorio (Marzo 2025) Colab utiliza Python 3.11 y no debería haber inconvenientes para ejecutar las notebooks de la materia con esta herramienta. Pasos a seguir:
-
Desde Colab, ir al menú File y hacer click en Open Notebook.
-
En la nueva ventana que se abre, ir a la opción GitHub (en el menú de la derecha).
-
En la barra buscadora, copiar el nombre del repo:
FIUBA-Posgrado-Inteligencia-Artificial/CEIA_Analisis_de_datos
- Asegurarse que en Repository aparezca el nombre correcto (
FIUBA-Posgrado-Inteligencia-Artificial/CEIA_Analisis_de_datos
) y la branch sea main. Hacer click en la notebook deseada para abrir.