Econometric Model - Predicción de Precios de Casas

Hecho por:

Kevin Sebastián Cifuentes López.
Mariana Lopera Correa.

En este proyecto, se desarrolla un modelo de Machine Learning para predecir los precios de venta de viviendas en Ames, Iowa, Estados Unidos. El conjunto de datos utilizado fue sacado de Kaggle link datos, este contiene información detallada sobre diversas características de las casas, como el tamaño del lote, el área habitable, la calidad de construcción, el año de construcción, entre otros. El objetivo es utilizar estas características para entrenar un modelo de regresión lineal que pueda predecir con precisión el precio de venta de una casa.

El modelo no solo se enfoca en predecir los precios actuales, sino que también está diseñado para realizar proyecciones futuras, permitiendo estimar cómo podrían evolucionar los precios de las viviendas en los próximos años. Esto es especialmente útil para inversionistas, agentes inmobiliarios y propietarios que deseen tomar decisiones informadas basadas en tendencias del mercado.

Cómo Ejecutar el Proyecto

1. Instalación de Dependencias

Asegúrate de tener instaladas las siguientes bibliotecas:

pip install numpy pandas scikit-learn matplotlib seaborn tabulate

2. Clonar el repositorio

git clone https://github.com/Mayday3003/EconometricModel_ML.git

3. Ejecución del Programa

Para ejecutar el programa, usa el siguiente comando:

python src/view/console/main.py

Esto cargará los datos, entrenará el modelo y hará predicciones futuras.

Pruebas Unitarias

Para ejecutar las pruebas unitarias, usa el siguiente comando:

python -m unittest tests/test_model.py

Descripción de los Archivos

1. `src/model/`

Contiene la lógica del negocio y las operaciones relacionadas con los datos y el modelo.

data_preparation.py: Funciones para cargar, limpiar y preparar los datos.
feature_engineering.py: Funciones para crear nuevas características (features) y transformar los datos.
model_training.py: Funciones para entrenar y evaluar modelos.
future_predictions.py: Funciones para generar datos futuros y hacer predicciones.

2. `src/view/`

Maneja la interacción con el usuario y la visualización de resultados.

console/main.py: Punto de entrada para la interfaz de consola.
results/visualization.py: Funciones para visualizar resultados (gráficos, métricas, etc.).

3. `src/controller/`

Gestiona la comunicación entre el modelo y la vista.

data_controller.py: Controla la carga y preparación de los datos.
model_controller.py: Controla el entrenamiento y la evaluación del modelo.

4. `tests/`

Contiene pruebas unitarias para cada módulo del proyecto.

test_data_preparation.py: Pruebas para la preparación de datos.
test_feature_engineering.py: Pruebas para la ingeniería de características.
test_model_training.py: Pruebas para el entrenamiento y evaluación del modelo.

5. `data/`

Contiene los datos utilizados para entrenar y evaluar el modelo.

train.csv: Conjunto de datos de entrenamiento.

6. `config.py`

Archivo de configuración para rutas y parámetros del proyecto.

7. `.gitignore`

Archivo para ignorar archivos y carpetas que no deben ser rastreados por Git.

Explicación del Código

1. Carga y Preparación de Datos

load_data(file_path): Carga los datos desde un archivo CSV.
split_data(data): Divide los datos en conjuntos de entrenamiento, validación y prueba.
divide_dataframes(dataframe): Llena valores nulos y prepara los datos para el modelado.

2. Ingeniería de Características

transform_target(dataframe_train, dataframe_validation_features, dataframe_test, target_column): Transforma la variable objetivo usando log1p.
group_by_mean_and_bin(df, df_full, column_name, bins, labels): Agrupa los datos por la media de saleprice y los divide en bins.
encode_categorical_columns(df, encoder): Codifica columnas categóricas usando LabelEncoder.

3. Entrenamiento y Evaluación del Modelo

train_model(x_train, train_target): Entrena un modelo de regresión lineal.
evaluate_model(model, X, y, dataset_name): Evalúa el modelo y muestra el puntaje.

4. Predicciones Futuras

generate_future_data(last_year, num_years): Genera datos futuros para los próximos años.
predict_future_prices(model, future_data, feature_columns): Predice los precios de las casas para los años futuros.

Visualización de Resultados

Consola

1. Gráfico de Líneas

Muestra la tendencia de los precios a lo largo del tiempo.

2. Tabla Formateada

Muestra una tabla de esta forma, para facilitar la obsrvación de los resultados

yearbuilt predicted_price 0 2026 2746.285057 1 2027 2750.765683 2 2028 2755.253615

Contribuciones

Si deseas contribuir a este proyecto, sigue estos pasos:

Haz un fork del repositorio.
Crea una nueva rama (git checkout -b feature/nueva-funcionalidad).
Realiza tus cambios y haz commit (git commit -m 'Añade nueva funcionalidad').
Haz push a la rama (git push origin feature/nueva-funcionalidad).
Abre un Pull Request.

Licencia

Este proyecto está bajo la licencia MIT. Consulta el archivo LICENSE para más detalles.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Econometric Model - Predicción de Precios de Casas

Cómo Ejecutar el Proyecto

1. Instalación de Dependencias

2. Clonar el repositorio

3. Ejecución del Programa

Pruebas Unitarias

Descripción de los Archivos

1. `src/model/`

2. `src/view/`

3. `src/controller/`

4. `tests/`

5. `data/`

6. `config.py`

7. `.gitignore`

Explicación del Código

1. Carga y Preparación de Datos

2. Ingeniería de Características

3. Entrenamiento y Evaluación del Modelo

4. Predicciones Futuras

Visualización de Resultados

Consola

1. Gráfico de Líneas

2. Tabla Formateada

Contribuciones

Licencia

About

Uh oh!

Releases

Packages

Uh oh!

Contributors 2

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 66 Commits
data		data
sql		sql
src		src
tests		tests
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
config.py		config.py
secret_config.py		secret_config.py

License

Mayday3003/EconometricModel_ML

Folders and files

Latest commit

History

Repository files navigation

Econometric Model - Predicción de Precios de Casas

Cómo Ejecutar el Proyecto

1. Instalación de Dependencias

2. Clonar el repositorio

3. Ejecución del Programa

Pruebas Unitarias

Descripción de los Archivos

1. src/model/

2. src/view/

3. src/controller/

4. tests/

5. data/

6. config.py

7. .gitignore

Explicación del Código

1. Carga y Preparación de Datos

2. Ingeniería de Características

3. Entrenamiento y Evaluación del Modelo

4. Predicciones Futuras

Visualización de Resultados

Consola

1. Gráfico de Líneas

2. Tabla Formateada

Contribuciones

Licencia

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors 2

Uh oh!

Languages

1. `src/model/`

2. `src/view/`

3. `src/controller/`

4. `tests/`

5. `data/`

6. `config.py`

7. `.gitignore`

Packages