Skip to content

Repositorio de material práctico de la materia Análisis de Datos de la Carrera de Especialización en Inteligencia Artificial de la FIUBA

Notifications You must be signed in to change notification settings

FIUBA-Posgrado-Inteligencia-Artificial/CEIA_Analisis_de_datos

Repository files navigation

Bienvenidos al repositorio de la materia Análisis de Datos! Aquí encontrarán los materiales de clase, notebooks, datasets y recursos adicionales.

📂 Estructura del Repositorio

  • notebooks/ → Contiene las notebooks con los ejemplos y ejercicios de cada clase.
  • datasets/ → Conjunto de datos utilizados en los ejemplos y prácticas.
  • recursos/ → Ejericios, reportes y otros materiales útiles.
  • scripts/ → One-offs / no reutilizable.
  • utils/ → Funciones auxiliares utilizadas en las notebooks.

⚠️ Recordá que las diapositivas de las clases y los enunciados de los TPs se encuentran en el Campus posgrado de la FIUBA.

🎓 ¿Sos alumno de una cohorte anterior? Encontrá aquí las instrucciones para descargar los contenidos correspondientes a tu curso y bimestre.

📚 Contenido del Curso

Clase Tema Notebooks
1️⃣ Introducción al Análisis de Datos notebook_clase_1
2️⃣ Análisis exploratorio de datos (EDA) notebook_clase_2
3️⃣ EDA (cont.) y preprocesamiento notebook_clase_3_outliers
notebook_clase_3_datos_faltantes
4️⃣ Preprocesamiento (cont.) y Feature Engineering notebook_clase_4_codificación
notebook_clase_4_normalización_estandarización
notebook_clase_4_discretización
notebook_clase_4_desbalance
5️⃣ Taller práctico - parte 1 A ser agregada
6️⃣ Pruebas estadísticas y reducción de la dimensionalidad A ser agregada
7️⃣ Taller práctico - parte 2 A ser agregada
8️⃣ Automatización del análisis de datos A ser agregada

📚 Bibliografía recomendada aquí.

📅 Fechas importantes

  • Entrega del TP parte 1: Lunes 2 de junio de 2025 (hasta las 23:59 hora de Argentina).

  • Entrega del TP parte 2: Lunes 16 de junio de 2025 (hasta las 23:59 hora de Argentina).

  • Última clase: Jueves 19 de junio de 2025.

⚙️ Instalación y Configuración del Entorno

En esta sección se explican los pasos para utilizar este repositorio.

🔵 Opción 1: Usar un env de Conda

Prerrequisitos

  • Anaconda o miniconda
  • Git

1. Clonar el repositorio:

git clone https://github.com/FIUBA-Posgrado-Inteligencia-Artificial/CEIA_Analisis_de_datos.git
cd CEIA_Analisis_de_datos

2. Crear y activar el environment:

conda env create -f environment.yml
conda activate add-env

3. Abrir Jupyter:

jupyter notebook

🔵 Opción 2: Usar un env de Poetry

Este proyecto también permite usar Poetry para manejo de dependencias. Seguir los pasos detallados a continuación para crear un environment a partir de los archivos pyproject.toml y poetry.lock proporcionados.

Prerrequisitos

1. Clonar el repo:

git clone https://github.com/FIUBA-Posgrado-Inteligencia-Artificial/CEIA_Analisis_de_datos.git
cd CEIA_Analisis_de_datos

2. Crear el environment (ejemplo con Python 3.11, ajustar a 3.12 de ser necesario):

  • macOS/Linux
poetry env use python3.11  
  • Windows
poetry env use "py -3.11" 

3. Instalar dependencias (Linux/MacOS/Windows):

poetry install --no-root 

Nota: --no-root evita la instalación como package que no es necesaria aquí.

4. Verificar que el environment se instaló correctamente:

poetry env list

Este comando devuelve todos los environments asociados al proyecto (verificar que ceia-analisis-de-datos-xxxxxxx-py3.11 aparece en la lista)

poetry env info

Este comando muestra detalles tales como la versión de Python y el path (ej., /Users/<username>/Library/Caches/pypoetry/virtualenvs/... en macOS o C:\Users\<username>\AppData\Local\pypoetry\... en Windows).

5. Activar el environment:

  • macOS/Linux (zsh/bash):
eval "$(poetry env activate)" 
  • Windows (PowerShell/CMD):
Invoke-Expression (poetry env activate)

Después de ejecutar el comando, el nombre del environment debería aparecer en el prompt de la terminal entre paréntesis (ej., ceia-analisis-de-datos-py3.11).

6. Verificar activación:

python --version

Debería mostrar Python 3.11.X o 3.12.X.

which python  # macOS/Linux
where python  # Windows

Debería apuntar al Pyhton del env. de Poetry (ej., /Users//.../bin/python o C:\Users<username>...\Scripts\python.exe).

7. Registrar el environment en Jupyter:

poetry run python -m ipykernel install --user --name=ceia-analisis-de-datos --display-name "Python (CEIA)"

8. Abrir Jupyter y seleccionar el kernel correcto:

jupyter notebook

Una vez abierto Jupyter, ir a KernelChange Kernel y seleccionar "Python (CEIA)".

🔵 Opción 3: Usar Google Colab

Al momento de la actualización de este repositorio (Marzo 2025) Colab utiliza Python 3.11 y no debería haber inconvenientes para ejecutar las notebooks de la materia con esta herramienta. Pasos a seguir:

  1. Desde Colab, ir al menú File y hacer click en Open Notebook.

  2. En la nueva ventana que se abre, ir a la opción GitHub (en el menú de la derecha).

  3. En la barra buscadora, copiar el nombre del repo:

FIUBA-Posgrado-Inteligencia-Artificial/CEIA_Analisis_de_datos
  1. Asegurarse que en Repository aparezca el nombre correcto (FIUBA-Posgrado-Inteligencia-Artificial/CEIA_Analisis_de_datos) y la branch sea main. Hacer click en la notebook deseada para abrir.

📫 Contacto

Packages

No packages published

Contributors 3

  •  
  •  
  •