Skip to content

Проект посвящен разработке модели машинного обучения для прогнозирования оттока клиентов банка на основе исторических данных с целью снижения финансовых потерь.

License

Notifications You must be signed in to change notification settings

lodygin-mikhail/Bank_churn_EDA-ML

Repository files navigation

🏦 Прогнозирование оттока клиентов банка

📋 Описание проекта

Проект направлен на прогнозирование оттока клиентов банка с помощью машинного обучения. На основе исторических данных о клиентах строится модель, которая предсказывает вероятность ухода клиента из банка. Это позволяет принимать упреждающие меры для удержания клиентов и снижения финансовых потерь.

🎯 Бизнес-цель

Снижение оттока клиентов на 20% в течение года с сохранением 67,6 млн рублей годового дохода через:

  • Раннее выявление клиентов "группы риска"
  • Персонализированные маркетинговые кампании
  • Оптимизацию стратегий удержания

📊 Данные

Набор данных содержит информацию о 10,000 клиентов международного банка с филиалами во Франции, Германии и Испании.

📝 Признаки:

  • Customer ID: Уникальный идентификатор для каждого клиента
  • Surname: Фамилия клиента
  • Credit Score: Кредитный рейтинг клиента
  • Geography: Страна обслуживания клиента
  • Gender: Пол клиента
  • Age: Возраст клиента
  • Tenure: Количество лет сотрудничества клиента с банком
  • Balance: Банковский счет клиента
  • NumOfProducts: Количество продуктов, открытых в банке
  • HasCrCard: Имеет ли клиент кредитную карту (1 - да, 0 - нет)
  • IsActiveMember: Является ли клиент активным (1 - да, 0 - нет)

🎯 Целевая переменная:

  • Exited - факт ухода из банка (1 - ушел, 0 - остался)

🔍 Ключевые инсайты EDA

  1. Дисбаланс классов: только 21.37% клиентов ушли из банка
  2. География: клиенты из Германии уходят чаще (32%) чем из Франции (16%) и Испании (16%)
  3. Возраст: чем старше клиент, тем выше вероятность оттока
  4. Продукты: клиенты с 3-4 продуктами уходят значительно чаще
  5. Активность: неактивные клиенты уходят в 2 раза чаще

📊 Моделирование

Использованные алгоритмы:

  • Logistic Regression
  • Decision Tree
  • Random Forest
  • Gradient Boosting (XGBoost)
  • Support Vector Machines

Лучшая модель:

Random Forest с параметрами:

  • Accuracy: 0.9526
  • Recall: 0.87 (минимизация False Negative)
  • Precision: 0.92

💰 Экономический эффект

Расчет стоимости ошибок модели:

  • False Negative (пропущенный уход): 60,000 ₽ на клиента
  • False Positive (ложное предсказание): 3,000 ₽ на клиента
  • True Positive (верное предсказание): +57,000 ₽ на клиента

Общий эффект от внедрения: 67.6 млн рублей в год

⚙️ Установка и запуск

# Клонирование репозитория
git clone https://github.com/lodygin-mikhail/Bank_churn_EDA-ML.git

# Установка зависимостей
conda env create -f environment.yml
conda activate ML-base

# Запуск ноутбука с анализом
jupyter notebook bank_churn_prediction.ipynb

📜 Лицензия

MIT License © 2025

About

Проект посвящен разработке модели машинного обучения для прогнозирования оттока клиентов банка на основе исторических данных с целью снижения финансовых потерь.

Resources

License

Stars

Watchers

Forks