Финансовая сфера

Банковское обозрение


  • Мы строим ИИ-ассистентов нового поколения
27.03.2025 FinTechАналитика

Мы строим ИИ-ассистентов нового поколения

Генеративный искусственный интеллект (GenAI) в банковском секторе — тема, которая стремительно выходит за рамки только дискуссий и становится реальностью. Какие задачи он может решать уже сейчас? Готовы ли клиенты к взаимодействию с ИИ? Почему скорость реакции критична для голосовых интерфейсов? Об этом в эксклюзивном интервью «Банковскому обозрению» рассказал Александр Цепелев, технический директор компании Fromtech, внедряющей инновационные речевые технологии в бизнес-процессы финансового сектора


— Александр, насколько GenAI готов к использованию в банковском секторе?

— Мы стоим на пороге масштабного перехода от традиционных голосовых ботов к интеллектуальным ИИ-ассистентам, которые способны адаптироваться к контексту диалога. Однако критически важно понимать, что клиенты не готовы полностью отказаться от операторов. По нашим данным, до 90% пользователей все еще предпочитают живое общение, и это не столько технологическая проблема, сколько вопрос восприятия.

Если с точностью у Generative AI все в порядке, то эмоциональная составляющая пока отстает.

Российские модели пока не научились естественной эмпатии и гибкости, как это могут делать люди. Однако технологии развиваются, и в ближайшие годы голосовые ИИ-системы научатся учитывать тональность, интонацию и контекст взаимодействия, что сделает их полноценной альтернативой операторам.

— Какие задачи голосовой GenAI может взять на себя в банковском клиентском сервисе?

— В первую очередь — сложные и непредсказуемые запросы. Традиционные голосовые боты, работающие по скриптам, могут эффективно закрывать рутинные задачи: уведомления, статусы платежей, простые консультации. Но если клиент, например, звонит с вопросом: «У меня премиальная карта, а за снятие наличных за границей списали комиссию. Почему?», то традиционный бот здесь бессилен. Оператор же потратит время на поиск информации, заставив клиента слушать музыку на удержании. Кроме того, основной вызов — скорость отклика. RAG-система справляется с запросом за секунду.

— Как работает такая система?

— Архитектура системы включает в себя несколько ключевых компонентов. На передовой — NLU (Natural Language Understanding. — Ред.), система, которая интерпретирует запрос клиента. Далее подключается RAG-модель (Retrieval-Augmented Generation. — Ред.) — технология, позволяющая «генеративному ИИ» не выдумывать ответ, а подтягивать фактические данные из базы знаний банка. Затем вступает в игру LLM (Large Language Model. — Ред.) — большая языковая модель, которая формулирует естественный ответ.

— Каковы основные технические сложности при внедрении голосового Gen AI в банковскую инфраструктуру?

— Главный вызов — это большие задержки на ответ. В чатах клиент готов ждать от двух до пяти секунд, но в голосовом взаимодействии задержка более 1 секунды уже вызывает раздражение. Сегодняшние модели работают с задержкой две секунды — это неприемлемо. В компании Fromtech мы создаем и тестируем технологии Realtime LLM, которые позволяют обрабатывать и генерировать ответ в процессе распознавания речи, сокращая задержку до уровня, близкого к живому диалогу.

Другой нюанс, или требование — это интеграция голосового ИИ в существующие системы банка, такие как CRM, базы данных клиентов, антифрод-системы и платежные платформы. Здесь банки сталкиваются с несколькими ключевыми проблемами, первая из которых — размещение in-house vs облачные решения.

Многие банки по соображениям безопасности не готовы передавать клиентские данные в облако. Это значит, что AI должен работать внутри инфраструктуры банка (on-premise). Это требует серьезных инвестиций в серверные мощности, GPU для работы с большими языковыми моделями (LLM) и системы управления нагрузкой.

Кроме того, у каждого банка — своя уникальная IT-инфраструктура, часто состоящая из устаревших решений (legacy-систем). Интеграция требует разработки API-шлюзов и глубокой кастомизации под конкретные бизнес-процессы. Проблема еще и в том, что большинство самописных CRM банков не рассчитаны на взаимодействие с ИИ, а значит, требуется доработка программных интерфейсов. Также стоит отметить, что банки обязаны соблюдать законы о защите персональных данных, что усложняет передачу информации даже внутри корпоративных сетей.

Александр Цепелев (Fromtech). Фото: Надежда Дьякова / «Б.О»

Александр Цепелев (Fromtech). Фото: Надежда Дьякова / «Б.О»

— Какие подходы помогают упростить интеграцию?

— Мы, в Fromtech, используем гибридную модель, при которой часть задач обрабатывается локально (on-premise), а часть — в облаке. Например, критические данные (транзакции, пароли, персональная информация) остаются в инфраструктуре банка, а модели предсказания поведения, анализ намерений клиента (NLU) или генерация сложных ответов (LLM) могут работать в частном облаке, которое не хранит персональные данные. Это снижает нагрузку на серверы банка, позволяет оптимизировать вычислительные мощности и ускоряет внедрение Generative AI в банковскую среду.

— Почему традиционные голосовые боты плохо справляются с перебиваниями в разговоре?

— Обычные голосовые боты работают по линейному сценарию: Клиент задает вопрос — бот ждет окончания фразы — после полной обработки вопроса генерируется ответ. Проблема в том, что в живом разговоре клиенты часто перебивают ИИ или задают уточняющие вопросы до того, как бот закончил ответ. Это приводит к двум негативным эффектам: клиент чувствует, что бот «не слышит» его, а просто зачитывает заготовленный ответ; разговор становится медленным и раздражающим, так как клиент ждет окончания ненужной информации.

— Как Fromtech решает эту проблему?

— Мы внедряем динамическое распознавание речи в реальном времени (VAD — Voice Activity Detection). ИИ постоянно «слушает» клиента во время генерации ответа. Если клиент начинает говорить параллельно с ботом, ИИ приостанавливает генерацию текущего ответа, фиксирует новое уточнение клиента, сразу перестраивает свою логику, понимая контекст изменения вопроса. Если клиент прерывает робота, потому что ответ не нужен, ИИ это распознает и не настаивает на полной генерации текста. Таким образом, Generative AI начинает работать по тем же принципам, что и живой оператор.

— Можно ли сравнить это с работой человеческого мозга в диалоге?

— Да, именно это мы и делаем. Человек во время разговора не ждет полной формулировки, а адаптирует ответ на лету. Например, если клиент говорит: «Какая у меня процентная ставка по кредиту?» и тут же добавляет: «Стоп, я имел в виду ставку по вкладу», обычный бот уже начал отвечать на первый вопрос и не может перестроиться. Робот останавливает начатый ответ, понимает, что клиент уточнил вопрос, и перестраивает диалог без пауз и задержек.

— Как это влияет на восприятие ИИ?

— Это делает взаимодействие максимально естественным. Клиент больше не ощущает, что говорит с запрограммированным скриптом.

— Как банки воспринимают внедрение голосового ИИ?

— Серьезно, но осторожно. В финансовой сфере цена ошибки крайне высока — неправильная информация в ответе может стоить банку не только денег, но и доверия клиентов. Именно поэтому многие банки пока тестируют ИИ-ассистентов в ограниченных сценариях.

Но тренд очевиден — голосовые технологии становятся стандартом. Мы видим активный спрос со стороны банковского сектора, особенно на решения, которые можно гибко адаптировать под конкретные бизнес-процессы.

— Когда ИИ заменит операторов?

— Голосовой ИИ уже сегодня меняет правила игры в клиентском сервисе банков. Вопрос не в том, заменит ли он операторов, а в том, когда именно это произойдет. Банковские клиенты привыкают к удобству цифровых сервисов, а голосовой ИИ — их следующий логичный шаг.

Компания Fromtech, инвестируя в скорость, точность и гибкость голосовых технологий, делает этот переход более плавным и эффективным. Голосовые ассистенты будущего — это не просто боты, а полноценные цифровые коллеги, способные вывести клиентский сервис на новый уровень.

Реклама. ИНН: 5024198630 ЕРИД: 2VfnxxWfpEL





Новости Релизы