Банковское обозрение (Б.О принт, BestPractice-онлайн (40 кейсов в год) + доступ к архиву FinLegal-онлайн)
FinLegal ( FinLegal (раз в полугодие) принт и онлайн (60 кейсов в год) + доступ к архиву (БанкНадзор)
Перед созданием модели требуется оценить, имеет ли смысл ее разрабатывать и насколько она технически осуществима. Затем нужно собрать, очистить и разметить данные, поставить множество экспериментов. Это все — об MLOps
В силу своей относительной новизны некоторые аспекты машинного обучения (ML) в банках продолжают оставаться в тени, а многие, недооценивая ИИ, считают его чем-то вроде (за)умной колонки с «Марусей». Между тем специалисты, погруженные в тему, утверждают, что «все ML-системы проживают долгую и богатую на события жизнь». Это происходит, потому что ML, как это было в свое время с IT, незаметно проникло во множество бизнес-процессов кредитно-финансовых учреждений и, что называется, растворилось в них, создав критическую зависимость современных банков от ИИ. А вот это привело к задаче управления жизненным циклом всех без исключения моделей с учетом специфических модельных рисков.
Как этого добиться в реальности? Лучшие международные и отечественные практики говорят о том, что с этим на сегодняшний день лучше всего справляются IT-системы, один или несколько компонентов которых содержат в себе обученную модель, выполняющую какую-то часть общей бизнес-логики. Как утверждают эксперты компании Selectel в своем исследовании, эту часть бизнес-логики, как и любые другие компоненты системы, необходимо регулярно обновлять, чтобы соответствовать меняющимся ожиданиям бизнеса и клиентов. В этом обновлении, причем регулярном, и заключается MLOps — своего рода DevOps для ML-моделей.
В каких конкретных банковских бизнес-процессах используются модели и почему их работа критически важна? Яркий пример из сферы ИБ: команда разработчиков Альфа-Банка создала специальную модель машинного обучения, которая следит за всеми транзакциями и моментально сообщает службе безопасности, если находит что-нибудь подозрительное. ИИ оценивает каждую транзакцию по множествам показателей и решает, есть ли в ней отличие от безопасного сценария. С помощью продвинутой аналитики за 0,03 секунды в банке оценивают каждый перевод по 3501 параметру — так, на январь 2023 года проверили уже 60 млн переводов.
РСХБ завершил проект по внедрению цифровой маркетинговой платформы на облачных технологиях. Решение представляет собой набор инструментов, построенных на базе ИИ. Платформа обеспечивает сбор и анализ данных о поведении клиентов и пользователей в цифровых каналах в режиме реального времени, дает возможность сопоставлять данные о клиентах из всех подключенных источников экосистемы «Свое».
И, конечно, классика — скоринг, как правило, встроенный в кредитный конвейер как в крупных, так и в небольших финансовых организациях. В частности, в кредитном конвейере ВТБ реализована платформа исполнения моделей на микросервисах, которая позволяет предоставлять различным потребителям модель-как-сервис (MaaS) с использованием различных фреймворков обработки данных как в режиме онлайн с малым временем ответа и высокой нагрузкой, так и в пакетном режиме для обработки практически любых объемов данных. Применение методов автоматического машинного обучения (AutoML) ускоряет процесс вывода продуктов на рынок.
Региональный банк «Дальневосточный» в августе 2023 года сообщил о внедрении универсального модуля «Dynamika — кредитный конвейер», который позволяет в три раза ускорить обработку и рассмотрение кредитных заявок, а также существенно упрощает запуск новых кредитных продуктов.
Что касается моделей, используемых для распознавания документов, работы чат-ботов, оптимизации контакт-центров и CRM, рекомендательных сервисов и т.д., то наблюдается их повсеместное распространение.
Модель — это всегда комплекс рисков. В 2020 году на основе зарубежного опыта аналитики компании Zeb в статье в «Б.О» так описали проблему: «Сложность управления модельным риском заключается в следующем: наблюдение за моделями проводится не на постоянной основе. Поскольку проверять корректность работы моделей непрерывно невозможно, ошибки моделей могут быть пропущены или обнаружены с опозданием. Чем активнее меняются внешние и внутренние условия, тем чаще возникают ошибки, поэтому управление модельным риском становится более актуальным в кризисы».
Как в воду смотрели аналитики. До сих пор не решенная техническая проблема в наших условиях обросла целым букетом проблем, ставших «более актуальными в кризисы». Одна из них — импортозамещение, а точнее — создание практически с нуля отечественных систем AutoML и MLOps в условиях, когда, например, поведенческие или скоринговые модели меняются буквально еженедельно.
Именно эта скорость перевела практику работы с моделями в процессное русло и резко изменила направление инженерной мысли (как правило, в области свободного ПО), сместив на обочину маститых вендоров в области управления рисками и т.д.
На конференции ScorFest 2023 Павел Николаев, руководитель управления технологий машинного обучения Альфа-Банка, пошутил на эту тему: «Революция, о которой так долго говорили представители DevOps, свершилась. Опираясь на текущий “золотой стандарт” от компании Databricks, которая первой развернула в облаке стабильную open-source-инфраструктуру CI/CD уже не для программного кода, а для машинного обучения с использованием стандартного стека ПО для DevOps на базе Kubernetes, самые технологичные банки России с помощью своих собственных ресурсов, по сути, “импортозаместились” еще в начале 2020-х. А вот остальные вступили в эпоху великого передела рынка MLOps».
Революционной идеей компании Databricks стало то, что ресурсы ML, такие как код, данные и модели, можно разрабатывать поэтапно, а не в рамках концепции «монолита». Таким образом, в процессе разработки перемещается код, а не ML-модели из одной среды в другую. Такое перемещение ресурсов проекта гарантирует, что весь код в процессе разработки системы машинного обучения проходит одни и те же процессы проверки и интеграционного тестирования. Кроме того, такой вариант развертывания гарантирует, что производственная версия модели обучена именно производственному датасету.
Но, как это обычно бывает, есть нюансы, которые могут похоронить любой проект, если разработчики их игнорируют. Вокруг этих нюансов и развернулся «великий передел рынка». Тем не менее успешные кейсы есть, и их немало.
Например, в мае 2023 года ГК «Корус консалтинг» создала для Абсолют банка среду для централизованной фабрики ML на базе Yandex.Cloud. Решение позволяет качественнее оценивать риски, связанные с предоставлением кредитов, гарантий и других банковских продуктов.
Среда дает возможность дата-сайентистам банка тестировать различные решения, направленные на повышение точности прогнозов, и «приземлять» ML-модели на конкретный процесс в рамках работы с клиентом.
Росбанк при поддержке партнера GlowByte с августа 2023 года внедряет систему управления моделями и модельным риском на базе решений Kolmogorov.ai. ПО разработано российским вендором Data Sapience. Новая система поможет банку повысить эффективность управления рисками, связанными с использованием продвинутых математических моделей при принятии решений.
А вот настоящей энциклопедией отечественного MLOps стали лучшие практики банка «Открытие», который в 2021 году в числе первых внедрил платформу для разработки и эксплуатации моделей машинного обучения IRIS. Отрадно, что сообщество дата-сайентистов привносит в них свой опыт, делая отечественные решения конкурентоспособными на мировом рынке.
Процедура выдачи кредитов МСП когда-то считалась делом долгим, затратным и несущим повышенные риски. О том, как в ПСБ удалось изменить ситуацию ровно наоборот, рассказал Александр Чернощекин, старший вице-президент — руководитель блока среднего и малого бизнеса Промсвязьбанка