- 📝 Sobre el Proyecto
- ⚡ Características principales
- 🔧 Posibles mejoras
- 👨💻 Tecnologías utilizadas
- ⚙ Instalación y uso en Google Colab
- 📂 Estructura del proyecto
- 🌟 Estado del proyecto
PROYECTO_4-_REDES es un sistema desarrollado en Python que permite analizar y visualizar parámetros críticos en agua subterránea, como nitratos, arsénico, tricloroetileno y tetracloruro de carbono. El objetivo principal es facilitar la toma de decisiones mediante la limpieza, análisis y visualización de datos provenientes de muestreos de agua.
El sistema incluye las siguientes funcionalidades:
- Carga y limpieza de datos: Procesa archivos Excel eliminando filas/columnas vacías, normalizando nombres de columnas y manejando valores faltantes.
- Análisis Exploratorio de Datos (EDA): Genera estadísticas descriptivas y detecta valores faltantes.
- Visualización de datos: Crea gráficos de barras apiladas para analizar la distribución de parámetros por región y rango, así como histogramas de cantidad de muestras por región.
- Identificación de valores fuera de norma: Detecta y visualiza pozos con concentraciones superiores a los límites regulatorios.
✅ Limpieza y normalización de datos provenientes de archivos Excel.
✅ Análisis de parámetros críticos: nitratos, arsénico, tricloroetileno y tetracloruro de carbono.
✅ Gráficos de barras apiladas con porcentajes dentro de las barras para cada parámetro.
✅ Eliminación de datos no relevantes, como regiones o distritos "NO DETERMINADA".
✅ Identificación de pozos con valores fuera de norma según los límites regulatorios.
✅ Exportación de datos limpios a formatos Excel y CSV.
❌ Implementar un sistema de predicción para la evolución de parámetros críticos.
❌ Agregar más opciones de visualización, como gráficos de líneas para tendencias temporales.
❌ Optimizar el manejo de grandes volúmenes de datos para mejorar el rendimiento.
❌ Automatizar la generación de informes ejecutivos en formato PDF.
- Lenguaje de programación: Python
- Librerías principales:
pandas
: Para la manipulación y análisis de datos.numpy
: Para cálculos numéricos.matplotlib
yseaborn
: Para la creación de gráficos.
- Entorno de trabajo: Google Colab
- Accede al archivo del proyecto en el repositorio de GitHub:
PROYECTO_4-_REDES - Descarga el archivo
Proyecto_4_Redes.ipynb
, con Archivo REDES 2014 o ábrelo directamente en Google Colab.
- Ejecuta la celda correspondiente para cargar el archivo Excel con los datos de muestreo.
- Sube el archivo desde tu computadora cuando se solicite.
- Ejecuta las celdas del notebook en orden para realizar las siguientes tareas:
- Cargar y limpiar los datos.
- Realizar el análisis exploratorio (EDA).
- Visualizar los datos mediante gráficos.
- Identificar valores fuera de norma.
- Los resultados se mostrarán directamente en el notebook.
El proyecto está en desarrollo. Se han implementado las funcionalidades principales, pero aún hay áreas que requieren mejoras y optimización.
Si este proyecto te resulta útil, ¡marca el repositorio con una estrella en GitHub! ⭐