Skip to content
View MRiveraV24's full-sized avatar

Block or report MRiveraV24

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Please don't include any personal information such as legal names or email addresses. Maximum 100 characters, markdown supported. This note will be visible to only you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
MRiveraV24/README.md

👋 ¡Hola! Soy Marcelo Rivera

🌍 Transformando datos geocientíficos en soluciones estratégicas

¿Sabías que en la industria minera solo se aprovecha el 27% de los datos generados?

Esto significa que el 73% restante, lleno de oportunidades para optimizar procesos, reducir costos y tomar decisiones estratégicas, queda desaprovechado. Mi misión es cambiar esta realidad.


💡 Sobre mí

Con más de 10 años de experiencia en administración, análisis y modelado 3D de datos geocientíficos, he trabajado con grandes y medianas compañías mineras, así como con empresas de servicios, colaborando estrechamente con geólogos e ingenieros.


🌟 ¿Qué puedo aportar?

  • Diseño y administración de bases de datos geológicas: Organización y optimización de datos para garantizar su accesibilidad y calidad.
  • Toma de decisiones basada en datos: Uso de herramientas de análisis avanzado para generar insights clave.
  • Consultas SQL eficientes: Creación de consultas optimizadas para manejar grandes volúmenes de datos.
  • Visualización de datos: Desarrollo de tableros interactivos en Power BI que facilitan la toma de decisiones.
  • Modelado 3D y mapas temáticos: Creación de modelos geocientíficos precisos para proyectos de exploración y minería.
  • Aplicación de inteligencia artificial: Resolución de problemas complejos mediante Machine Learning y análisis predictivo.
  • Liderazgo en proyectos mineros: Coordinación de equipos multidisciplinarios y supervisión de operaciones en terreno.

📂 Proyectos Destacados

1️⃣ Detección de Neumonía Pediátrica mediante Inteligencia Artificial

📌 Descripción General:
Este proyecto utiliza inteligencia artificial para asistir en el diagnóstico de neumonía en radiografías de tórax pediátricas, una enfermedad que representa una de las principales causas de mortalidad infantil. A través de redes neuronales convolucionales (CNN), el sistema analiza imágenes médicas para proporcionar un soporte rápido y preciso a los médicos, especialmente en regiones con recursos limitados. Este enfoque no sustituye a los profesionales de la salud, sino que complementa su trabajo, mejorando la rapidez y calidad del diagnóstico.

🛠️ Tecnologías Empleadas:

  • Lenguaje: Python
  • Bibliotecas: TensorFlow, Keras (aprendizaje profundo), NumPy y Pandas (manipulación de datos), Matplotlib y Seaborn (visualización), Scikit-learn (evaluación de modelos), Keras Tuner (optimización de hiperparámetros).
  • Metodologías: Redes neuronales convolucionales, aprendizaje por transferencia, preprocesamiento de datos.

📈 Impacto:
El modelo ayuda a reducir el tiempo y la complejidad del diagnóstico de neumonía, proporcionando un valioso apoyo en áreas con acceso limitado a radiólogos capacitados. Contribuye a disminuir la mortalidad infantil al facilitar diagnósticos tempranos y más accesibles. Si bien hay margen para mejorar la precisión y el equilibrio en los datos, el proyecto destaca el potencial de la inteligencia artificial como herramienta complementaria en la medicina.

🔗 Ver Proyecto


2️⃣ Análisis Predictivo de Salarios y Contratación en el Sector Tecnológico

📌 Descripción: Este proyecto explora cómo los datos y el aprendizaje automático pueden transformar la gestión de recursos humanos en empresas de tecnología. Utilizando información clave de los postulantes, como experiencia y educación, se desarrollaron modelos predictivos para anticipar salarios y determinar probabilidades de contratación. El análisis revela patrones laborales y optimiza decisiones estratégicas en contratación.

🛠️ Tecnologías:

  • Python: Lenguaje principal del proyecto.
  • Bibliotecas: Pandas (análisis de datos), NumPy (cálculos numéricos), Scikit-learn (modelos de machine learning), Matplotlib y Seaborn (visualización).
  • Estas herramientas facilitaron un flujo de trabajo integral desde la preparación de datos hasta la evaluación de modelos predictivos.

📈 Impacto:

  • Predicción Salarial: Ayuda a las empresas a ofrecer salarios competitivos y ajustar presupuestos con base en datos.
  • Optimización de Contratación: Identifica a los candidatos más adecuados, reduciendo tiempo y costos.
  • Análisis del Mercado: Descubre tendencias y patrones relevantes en el sector tecnológico.
  • Mejor Toma de Decisiones: Minimiza sesgos y fomenta la equidad en la contratación mediante análisis objetivo.

🔗 Ver Proyecto

3️⃣ Segmentación de Clientes para Productos Financieros Personalizados

📌 Descripción: Este proyecto aplica técnicas avanzadas de análisis de datos para segmentar clientes de una institución financiera en grupos homogéneos, con el objetivo de ofrecer productos personalizados. Usando datos históricos, se identifican características clave de los clientes para optimizar estrategias de marketing, mejorar la asignación de nuevos clientes y maximizar la satisfacción del cliente.

🛠️ Tecnologías:

  • Python: Lenguaje principal para análisis y modelado.
  • Pandas: Manipulación y análisis de datos tabulares.
  • NumPy: Operaciones numéricas eficientes.
  • Matplotlib y Seaborn: Visualización de datos y gráficos descriptivos.
  • Scikit-learn: Algoritmos de clustering (K-means), reducción de dimensionalidad (PCA) y evaluación del modelo.
  • Plotly: Gráficos interactivos.
  • Yellowbrick: Visualización para selección del número óptimo de clusters.
  • SciPy: Análisis jerárquico de clústeres (dendrogramas).

📈 Impacto:

  • Personalización de productos: Adaptación de límites de crédito a las necesidades específicas de cada grupo.
  • Asignación inteligente de nuevos clientes: Clasificación automática en segmentos desde el inicio.
  • Optimización de marketing: Campañas dirigidas para maximizar la efectividad y minimizar costos.
  • Decisiones basadas en datos: Información clara para estrategias financieras más sólidas.
  • Comprensión de clientes: Identificación de patrones clave como la relación entre antigüedad y límite de crédito.

🔗 Ver Proyecto


4️⃣ Pipeline de Datos ETL para Análisis de Viajes de Uber en NYC (2014)

📌 Descripción: Este proyecto desarrolla una robusta canalización de datos ETL (Extracción, Transformación, Carga) con una arquitectura Medallón (Bronze, Silver, Gold) en Databricks Free Edition. Procesa más de 4.5 millones de registros de recogidas de Uber en NYC de abril a septiembre de 2014. Su objetivo es transformar datos crudos en insights accionables sobre patrones de demanda y rendimiento de bases, permitiendo la toma de decisiones estratégicas.


🛠️ Tecnologías:

  • Databricks Free Edition: Se utilizó como plataforma unificada para el procesamiento de datos y la colaboración, aprovechando las optimizaciones de Apache Spark para grandes volúmenes de datos y su soporte nativo para Delta Lake. Su edición gratuita fue ideal para demostrar las capacidades de la plataforma sin costos iniciales.
  • Delta Lake: Proporciona fiabilidad (transacciones ACID), crucial para pipelines robustos. Permite la evolución de esquemas y está optimizado para grandes volúmenes de datos, facilitando la auditoría y el control de versiones. Se integra de forma nativa con Apache Spark.
  • Power BI: Empleado para visualización interactiva, creando dashboards y reportes dinámicos. Permite la conectividad directa a Delta Lake (a través de Databricks SQL Analytics Endpoint) para consumir eficientemente los datos de la capa Gold.

📈 Impacto:

El proyecto logró construir una canalización de datos ETL de extremo a extremo robusta y escalable, facilitando la ingesta eficiente, la transformación de calidad y el modelado de datos para el negocio. Esto permitió proporcionar una base de datos confiable y estructurada para que los analistas de negocio y científicos de datos respondan preguntas críticas, abordando desafíos como la ineficiencia operacional y la planificación estratégica.

Hallazgos clave y métricas obtenidas incluyen:

  • Crecimiento Mensual de Viajes: Se observó un crecimiento sostenido y significativo mes a mes, con un aumento del 24% en septiembre de 2014, lo que indica una rápida adopción del servicio de Uber en NYC.
  • Patrones de Demanda por Hora del Día: La demanda horaria muestra un patrón claro de "horas pico" durante la tarde y noche (especialmente entre las 17:00 y las 21:00), lo cual es crucial para la gestión de la flota y las tarifas dinámicas.
  • Rendimiento por Base de Operaciones: Las bases B02617, B02598 y B02682 dominaron el volumen de viajes, manejando la mayor parte de las recogidas y siendo pilares de la operación.
  • Hotspots Geográficos de Demanda: El análisis geoespacial identificó áreas de alta concentración de recogidas, como Midtown Manhattan, el Distrito Financiero y el East Village, indicando dónde concentrar la oferta de vehículos.

Estos insights son fundamentales para optimizar la asignación de conductores, mejorar la experiencia del usuario y guiar la planificación estratégica de Uber en Nueva York.

🔗 Ver Proyecto


📊 Habilidades

  • Lenguajes de Programación: Python, Markdown.
  • Manipulación de Datos: Pandas, NumPy.
  • Visualización: Power BI, Seaborn, Matplotlib.
  • Machine Learning y Deep Learning: Scikit-learn, TensorFlow, PyTorch,Keras.
  • Procesamiento de Lenguaje Natural: NLTK, Spacy.
  • Base de datos: Microsoft SQL Server, SQLITE, Erwin Data Modeler.
  • IDEs y Entornos de desarrollo: Jupyter, Google Colab.
  • Diseño y Sistemas de Información Geográfica (GIS): Autocad, Canva, QGIS, ARCGIS.
  • Gestión de Datos y Modelamiento Geológico 3D: Datamine Fusion, Datamine Studio RM, Leapfrog Geo.
  • Sistemas ERP: SAP (MM, CO).

🎓 Formación Académica y Continua

  • Bootcamp en Ciencia de Datos e Inteligencia Artificial - Universidad del Desarrollo (2023-2024).

  • Ingeniería en Informática - Universidad Tecnológica de Chile (2007-2010), (Estudios Incompletos).

  • Técnico Universitario en Geología - Universidad de Atacama (1997-1999).

  • Cursos Relevantes:

    • Aplicaciones en Python para Perforación y Tronadura de Rocas (2024).
    • Azure AI Fundamentals (2023).
    • Análisis de Datos con Power BI (2021)
    • Modelamiento de Base de Datos y Consultas con SQL Server (2020).
    • Modelado y Estimación en Studio RM (2020).
    • Aseguramiento y Control de Calidad en la Exploración Geológica y Minera (2019).
    • Sistema de Información Geográfica con ArcGIS 10 (2014).

💬 Contáctame

🌐 LinkedIn
📧 marcelo.rivera.vega@gmail.com


🔴 Instrucciones de Instalación y Ejecución

Requisitos previos

Asegúrate de tener instalados los siguientes elementos antes de comenzar:

Pasos generales para ejecutar el proyecto

Sigue estas instrucciones para clonar y ejecutar el código de este proyecto:

  1. Clonar el repositorio
    Clona este proyecto en tu máquina local:

    git clone https://github.com/MRiveraV24/Proyecto_01.git
  2. Navegar al directorio del proyecto
    Accede al directorio raíz del proyecto:

    cd Proyecto_01
  3. Crear y activar un entorno virtual (opcional, pero recomendado)

    python -m venv env
    source env/bin/activate  # En macOS/Linux
    .\env\Scripts\activate   # En Windows
  4. Instalar las dependencias
    Instala las bibliotecas necesarias utilizando el archivo requirements.txt:

    pip install -r requirements.txt
  5. Ejecutar el código
    Ejecuta el archivo principal del proyecto:

    python Cuaderno/Proyecto_01.py

Notas adicionales

  • Estructura del proyecto: Asegúrate de que los archivos necesarios, como los datos de entrada o configuraciones, estén en las rutas correspondientes especificadas en el script. Consulta el README.md del proyecto para más detalles específicos.
  • Reportar problemas: Si encuentras algún problema, por favor, abre un issue aquí.

¡Gracias por visitar mi portafolio! Estoy disponible para responder cualquier pregunta y discutir posibles oportunidades de colaboración. No dudes en contactarme para explorar cómo podemos trabajar juntos y alcanzar grandes logros.


📊 Estadísticas de GitHub:

MRiveraV24 github stats

Popular repositories Loading

  1. Proyecto_01 Proyecto_01 Public

    Proyecto 1

    Jupyter Notebook

  2. MRiveraV24 MRiveraV24 Public

  3. Proyecto_02 Proyecto_02 Public

    Jupyter Notebook

  4. Proyecto_03 Proyecto_03 Public

    Jupyter Notebook

  5. postgis-workshops postgis-workshops Public

    Forked from postgis/postgis-workshops

    PostGIS training materials

    Python

  6. git-prueba git-prueba Public