Skip to content

📊 Trabajos prácticos - TA047 Ciencia de Datos (1C2025) FIUBA · Cátedra Rodríguez · Repositorio con los TPs realizados durante la cursada.

Notifications You must be signed in to change notification settings

CD-GRUPO3/TA047R-1C2025-GRUPO03

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 

Repository files navigation

TA047 Ciencia de Datos - Cátedra Rodríguez 1C2025 | Facultad de Ingeniería UBA

Grupo 03
Integrantes:


TP 1: Análisis Exploratorio de Datos - Modelos de Clasificación Binaria - Regresión - Agrupamiento (Clustering)

Cada ejercicio incluye análisis, preprocesamiento, modelado, evaluación y visualización de resultados. Se abordaron cuatro ejercicios principales:

  1. Análisis exploratorio sobre datos de viajes en taxis Yellow Cab (EE.UU.), para comprender las características, detectar datos faltantes y valores atípicos, y generar nuevas variables.

  2. Modelos de clasificación binaria para predecir lluvia al día siguiente a partir de datos meteorológicos de Australia, usando Árboles de Decisión, Random Forest y un Ensamble Híbrido (Voting).

  3. Modelos de regresión para predecir el precio de alquiler en Airbnb en Río de Janeiro, entrenando Regresión Lineal, XGBoost y KNN.

  4. Agrupamiento (clustering) de datos musicales de Spotify, utilizando K-Means para identificar grupos y caracterizarlos.


TP 2: Competencia en Kaggle - Clasificación de Sentimientos

Proyecto de clasificación de sentimiento en críticas cinematográficas en español. El objetivo fue predecir si una crítica es positiva o negativa, utilizando técnicas de procesamiento de lenguaje natural y modelos de machine learning.

Se aplicaron métodos de preprocesamiento como "bag of words" y vectorización del texto, y se entrenaron los siguientes modelos:

  • Naive Bayes
  • Random Forest
  • XGBoost
  • Red Neuronal (PyTorch)
  • Ensamble Híbrido (Stacking con Random Forest, Naive Bayes y Regresión Logística; meta-modelo: XGBoost)

Cada modelo fue optimizado mediante búsqueda de hiperparámetros y evaluado con la métrica F1 en un conjunto de prueba. Las predicciones se enviaron a Kaggle para competir en el leaderboard.

About

📊 Trabajos prácticos - TA047 Ciencia de Datos (1C2025) FIUBA · Cátedra Rodríguez · Repositorio con los TPs realizados durante la cursada.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 4

  •  
  •  
  •  
  •