Данное исследование проводится с рамках развития продукта семейного банкинга
Построить модель бинарной классификации данных, которая позволит найти новых клиентов среди родственников текущих пользователей услуг Альфа-Банка. Для этого:
- Самостоятельно собрать таргет, используя информацию о держателях и пользователях карты.
- Обучить модель, используя приведенный датасет. По результатам обучения выбрать лучшую модель из нескольких вариантов.
- Предложить методы коммуникации с выбранным сегментом пользовательской базы для максимальной персонализации предложения. Процесс коммуникации может варьироваться с учетом особенностей пользователей.
- Составить дорожную карту развития проекта сроком на 1 год.
Таблица objects_cup.xlsx
содержит информацию о картах, информацию о владельцах и пользователях кодированном виде
card_uk
- id карты
cardapp_date
- дата открытия карты
owner_id
- id владельца карты
holder_id
- id держателя карты
Таблица feat_cup.csv
содержит информацию о клиенте(возраст, пол, доход, сегмент, страна, трансации по разным категориям и другие признаки). Всего 293 колонки. О полном составе таблицы можно ознакомится ноутбуке с проведением исследования
ML модель: CatBoostRegressor
EDA: python, pandas, numpy, mathplotlib, seaborn, scikit-learn, KNNImputer
presentation.pdf - презентация решения
При необходимости можно запросить дополнительно доступ к исходным данным чемпионата:
CL_Cup_IT_Data_Scince_секция_Кейс_Альфа_Банк.pdf - описание кейса чемпионата от организаторов
objects_cup.xlsx , feat_cup.csv - исходные данные
Более структурировано ознакомится с деталями и ходом исслеования вы можете ознакомится в файле презентации presentation.pdf и в ноутбуке по ссылке:
https://drive.google.com/file/d/185pQ7CGdrJUBeBAVGKI05huMyvpoqa60/view?usp=sharing
По итогам валидации модели и оценки экспертами решение заняло 4 место