#client_platform Разработка аналитического ML-инструмента для оценки справедливой стоимости фин инструментов и рыночных стратегий под запрос частного инвестиционного клиента Бизнес-задача: интерпретируемый результат ml, возможность backtest-оценки стратегии, модульность для простоты интеграции новых моделей
Система агрегирует данные с Binance/MOEX (WebSocket/REST), производит sampling (tick/volume/dollar/imbalance bars), расчет целевой переменной для регрессии или labelling для классификации, feature engineering(vwap, rsi и тд), проверку стационарности(ADF, KPSS тесты)-при необходимости фракционное дифференцирование или дифференцировнаие, масштабирование и обучение моделей на предобработанных данных. preprocessing_pipe_x - кастомный пайплайн который реализует полный цикл предобработки исходных предикторов. Для labelling используются методы, предложенные Marcos Lopez de Prado, -Fixed Horizon and Tripple Barrrier Method. Спецификация моделей вынесена в отдельный модуль- фабрику моделей- что упрощает добавление новых моделей в существующую архитектуру. (список моделей в model_factory.py) Также имплементирован модуль с RandomSearchCV для подбора оптимальных гиперпараметров модели. В виду computational intensity используется не GridSearch. Обученные модели сохраняются как бинарный .pkl файл и используются при inference и backtesting.
Для прогнозирования вызывается сохраненная предобученная модель и обучается на test данных, прошедших этапы предобработки. Модельные предсказания проходят backtest с расчётом финансовых (VaR, CVaR, Sharpe ratio, maximum drawdown) и ML-метрик (регрессия: r2, f1, precision; классификация: roc_auc, accuracy).
Разработка велась с учётом потребностей в интерпретируемости и модульности, деплой через FastAPI backend с REST-эндпоинтами и SQLite-хранилищем моделей.
Инструмент создавался как lightweight-альтернатива крупным Quant/BI-системам, но с полной автоматизацией ключевых стадий и возможностью встраивания в alpha-исследование стратегии