Банковское обозрение (Б.О принт, BestPractice-онлайн (40 кейсов в год) + доступ к архиву FinLegal-онлайн)
FinLegal ( FinLegal (раз в полугодие) принт и онлайн (60 кейсов в год) + доступ к архиву (БанкНадзор)
Генеративный искусственный интеллект (GenAI) в банковском секторе — тема, которая стремительно выходит за рамки только дискуссий и становится реальностью. Какие задачи он может решать уже сейчас? Готовы ли клиенты к взаимодействию с ИИ? Почему скорость реакции критична для голосовых интерфейсов? Об этом в эксклюзивном интервью «Банковскому обозрению» рассказал Александр Цепелев, технический директор компании Fromtech, внедряющей инновационные речевые технологии в бизнес-процессы финансового сектора
— Александр, насколько GenAI готов к использованию в банковском секторе?
— Мы стоим на пороге масштабного перехода от традиционных голосовых ботов к интеллектуальным ИИ-ассистентам, которые способны адаптироваться к контексту диалога. Однако критически важно понимать, что клиенты не готовы полностью отказаться от операторов. По нашим данным, до 90% пользователей все еще предпочитают живое общение, и это не столько технологическая проблема, сколько вопрос восприятия.
Если с точностью у Generative AI все в порядке, то эмоциональная составляющая пока отстает.
Российские модели пока не научились естественной эмпатии и гибкости, как это могут делать люди. Однако технологии развиваются, и в ближайшие годы голосовые ИИ-системы научатся учитывать тональность, интонацию и контекст взаимодействия, что сделает их полноценной альтернативой операторам.
— Какие задачи голосовой GenAI может взять на себя в банковском клиентском сервисе?
— В первую очередь — сложные и непредсказуемые запросы. Традиционные голосовые боты, работающие по скриптам, могут эффективно закрывать рутинные задачи: уведомления, статусы платежей, простые консультации. Но если клиент, например, звонит с вопросом: «У меня премиальная карта, а за снятие наличных за границей списали комиссию. Почему?», то традиционный бот здесь бессилен. Оператор же потратит время на поиск информации, заставив клиента слушать музыку на удержании. Кроме того, основной вызов — скорость отклика. RAG-система справляется с запросом за секунду.
— Как работает такая система?
— Архитектура системы включает в себя несколько ключевых компонентов. На передовой — NLU (Natural Language Understanding. — Ред.), система, которая интерпретирует запрос клиента. Далее подключается RAG-модель (Retrieval-Augmented Generation. — Ред.) — технология, позволяющая «генеративному ИИ» не выдумывать ответ, а подтягивать фактические данные из базы знаний банка. Затем вступает в игру LLM (Large Language Model. — Ред.) — большая языковая модель, которая формулирует естественный ответ.
— Каковы основные технические сложности при внедрении голосового Gen AI в банковскую инфраструктуру?
— Главный вызов — это большие задержки на ответ. В чатах клиент готов ждать от двух до пяти секунд, но в голосовом взаимодействии задержка более 1 секунды уже вызывает раздражение. Сегодняшние модели работают с задержкой две секунды — это неприемлемо. В компании Fromtech мы создаем и тестируем технологии Realtime LLM, которые позволяют обрабатывать и генерировать ответ в процессе распознавания речи, сокращая задержку до уровня, близкого к живому диалогу.
Другой нюанс, или требование — это интеграция голосового ИИ в существующие системы банка, такие как CRM, базы данных клиентов, антифрод-системы и платежные платформы. Здесь банки сталкиваются с несколькими ключевыми проблемами, первая из которых — размещение in-house vs облачные решения.
Многие банки по соображениям безопасности не готовы передавать клиентские данные в облако. Это значит, что AI должен работать внутри инфраструктуры банка (on-premise). Это требует серьезных инвестиций в серверные мощности, GPU для работы с большими языковыми моделями (LLM) и системы управления нагрузкой.
Кроме того, у каждого банка — своя уникальная IT-инфраструктура, часто состоящая из устаревших решений (legacy-систем). Интеграция требует разработки API-шлюзов и глубокой кастомизации под конкретные бизнес-процессы. Проблема еще и в том, что большинство самописных CRM банков не рассчитаны на взаимодействие с ИИ, а значит, требуется доработка программных интерфейсов. Также стоит отметить, что банки обязаны соблюдать законы о защите персональных данных, что усложняет передачу информации даже внутри корпоративных сетей.
Александр Цепелев (Fromtech). Фото: Надежда Дьякова / «Б.О»
— Какие подходы помогают упростить интеграцию?
— Мы, в Fromtech, используем гибридную модель, при которой часть задач обрабатывается локально (on-premise), а часть — в облаке. Например, критические данные (транзакции, пароли, персональная информация) остаются в инфраструктуре банка, а модели предсказания поведения, анализ намерений клиента (NLU) или генерация сложных ответов (LLM) могут работать в частном облаке, которое не хранит персональные данные. Это снижает нагрузку на серверы банка, позволяет оптимизировать вычислительные мощности и ускоряет внедрение Generative AI в банковскую среду.
— Почему традиционные голосовые боты плохо справляются с перебиваниями в разговоре?
— Обычные голосовые боты работают по линейному сценарию: Клиент задает вопрос — бот ждет окончания фразы — после полной обработки вопроса генерируется ответ. Проблема в том, что в живом разговоре клиенты часто перебивают ИИ или задают уточняющие вопросы до того, как бот закончил ответ. Это приводит к двум негативным эффектам: клиент чувствует, что бот «не слышит» его, а просто зачитывает заготовленный ответ; разговор становится медленным и раздражающим, так как клиент ждет окончания ненужной информации.
— Как Fromtech решает эту проблему?
— Мы внедряем динамическое распознавание речи в реальном времени (VAD — Voice Activity Detection). ИИ постоянно «слушает» клиента во время генерации ответа. Если клиент начинает говорить параллельно с ботом, ИИ приостанавливает генерацию текущего ответа, фиксирует новое уточнение клиента, сразу перестраивает свою логику, понимая контекст изменения вопроса. Если клиент прерывает робота, потому что ответ не нужен, ИИ это распознает и не настаивает на полной генерации текста. Таким образом, Generative AI начинает работать по тем же принципам, что и живой оператор.
— Можно ли сравнить это с работой человеческого мозга в диалоге?
— Да, именно это мы и делаем. Человек во время разговора не ждет полной формулировки, а адаптирует ответ на лету. Например, если клиент говорит: «Какая у меня процентная ставка по кредиту?» и тут же добавляет: «Стоп, я имел в виду ставку по вкладу», обычный бот уже начал отвечать на первый вопрос и не может перестроиться. Робот останавливает начатый ответ, понимает, что клиент уточнил вопрос, и перестраивает диалог без пауз и задержек.
— Как это влияет на восприятие ИИ?
— Это делает взаимодействие максимально естественным. Клиент больше не ощущает, что говорит с запрограммированным скриптом.
— Как банки воспринимают внедрение голосового ИИ?
— Серьезно, но осторожно. В финансовой сфере цена ошибки крайне высока — неправильная информация в ответе может стоить банку не только денег, но и доверия клиентов. Именно поэтому многие банки пока тестируют ИИ-ассистентов в ограниченных сценариях.
Но тренд очевиден — голосовые технологии становятся стандартом. Мы видим активный спрос со стороны банковского сектора, особенно на решения, которые можно гибко адаптировать под конкретные бизнес-процессы.
— Когда ИИ заменит операторов?
— Голосовой ИИ уже сегодня меняет правила игры в клиентском сервисе банков. Вопрос не в том, заменит ли он операторов, а в том, когда именно это произойдет. Банковские клиенты привыкают к удобству цифровых сервисов, а голосовой ИИ — их следующий логичный шаг.
Компания Fromtech, инвестируя в скорость, точность и гибкость голосовых технологий, делает этот переход более плавным и эффективным. Голосовые ассистенты будущего — это не просто боты, а полноценные цифровые коллеги, способные вывести клиентский сервис на новый уровень.