═══════════════════════════════════════════════
TelecomX LATAM es un proyecto de análisis de datos enfocado en comprender los factores detrás de la evasión de clientes (Churn). Mediante Python, Pandas y Matplotlib, se ejecuta un flujo ETL, estadísticas descriptivas, análisis exploratorio y visualizaciones estratégicas, generando insights claros y recomendaciones de negocio. Este proyecto forma parte de un desafío de prácticas reales para analistas de datos.
- Descripción del proyecto
- Requisitos del sistema
- Instrucciones de instalación
- Cómo ejecutar el análisis
- Estructura del código
- Resultados principales
- Conclusiones e insights
- Recomendaciones
- Problemas frecuentes y soluciones
- Créditos
El notebook desarrolla un flujo ETL completo:
- 📌 Extracción: Datos de clientes desde una API en formato JSON.
- 📌 Transformación: Limpieza, tratamiento de valores faltantes, estandarización de columnas y creación de "Cuentas_Diarias".
- 📌 Análisis Exploratorio: Métricas descriptivas (media, mediana, desviación), distribución del churn, análisis por variables categóricas y numéricas.
- 📌 Informe final: Introducción, metodología, visualizaciones y recomendaciones claras.
Lenguaje |
---|
Python >= 3.8 |
![]() |
Bibliotecas necesarias: | ||
---|---|---|
Pandas | Matplotlib | NumPy |
![]() |
![]() |
Entorno | |
---|---|
Jupyter Notebook | Google Colab |
![]() |
![]() |
pip install -r requirements.txt
git clone <URL-del-repositorio>
cd TelecomX_LATAM
pip install -r requirements.txt
jupyter notebook TelecomX_LATAM.ipynb
- Abre el notebook.
- Ejecuta paso a paso: conexión API, extracción, limpieza y EDA.
- Genera gráficos de distribución y correlación.
- Consulta insights en celdas Markdown.
- Introducción y objetivo del proyecto.
- Conexión y descarga de datos JSON.
- Exploración de la estructura del dataset.
- Limpieza y tratamiento de datos (valores nulos, duplicados).
- Creación de nuevas métricas ("Cuentas_Diarias").
- Análisis descriptivo y distribución de churn.
- Análisis por variables categóricas y numéricas.
- Visualizaciones estratégicas con Matplotlib.
- Informe final con recomendaciones.
- Distribución clara del churn general.
- Patrones por género, tipo de contrato, método de pago.
- Relación entre gasto total y evasión.
- Contratos mensuales y pagos electrónicos muestran mayor evasión.
- Clientes con soporte técnico frecuente tienden a cancelar más.
- Segmentos identificados para campañas de retención.
- Fidelizar clientes con contratos flexibles.
- Revisar la experiencia de facturación.
- Preparar modelos predictivos para detección temprana.
Problema | Solución |
---|---|
◉ API no responde | → Verificar token y endpoint |
◉ Error JSON | → Validar estructura de los datos |
◉ Librerías faltantes | → Ejecutar pip install -r requirements.txt |
Este análisis fue desarrollado como parte del Challenge Data Science LATAM , organizado por Alura , empleando datos públicos simulados con fines educativos.
Este trabajo fue realizado siguiendo lineamientos prácticos de ETL, EDA y presentación de resultados para facilitar decisiones estratégicas y apoyar el desarrollo de futuros modelos predictivos.
Autor:
Miguel Angel Ajhuacho |
Contacto profesional:
🚀 Utiliza este README como guía para entender y ejecutar el proyecto "Churn de Clientes" de TelecomX.