Финансовая сфера

Банковское обозрение


  • Как речевая аналитика в отделениях банка обеспечивает качество продаж и обслуживания
13.09.2023 FinCorpFinRetailFinSecurityFinTechАналитика

Как речевая аналитика в отделениях банка обеспечивает качество продаж и обслуживания

Речевая аналитика в банковских контакт-центрах — явление довольно распространенное и доказавшее свою эффективность. Но речевая аналитика в отделениях банка — решение еще редкое по ряду причин. Тем интереснее посмотреть на успешный кейс по созданию и внедрению вендорского решения. Что дает речевая аналитика в отделениях банку? Какие задачи решает? Насколько она необходима и что надо учитывать при реализации таких проектов? Эти и другие вопросы обозреватель «Б.О» обсудил с Юлией Вдовиной, директором по продукту цифровизации клиентского сервиса в дистанционных каналах компании BSS, и Александром Крушинским, директором департамента голосовых цифровых технологий компании BSS


— Юлия, речевая аналитика (РА) в банках набирает популярность. Как вы считаете, почему это происходит и какую выгоду она может дать банкам?

Юлия Вдовина: Ни для кого не секрет, что в банковском секторе России наблюдается довольно высокий уровень конкуренции. Все больше обостряется борьба за клиента. Причем, если раньше некоторые вопросы на горизонте довольно длительного периода времени решались выпуском нового продукта или удачным маркетинговым ходом, то сейчас и продукты, и технологии быстро копируются. Поэтому для удержания существующих клиентов и привлечения новых необходимо понимать потребности едва ли не каждого клиента и оперативно реагировать на них, постоянно отслеживать реакцию клиентов на то или иное нововведение, а это практически невозможно осуществить без использования речевой аналитики. Именно поэтому она стала уже «гигиеническим фактором» в процессах обслуживания и прочно вошла в стек банковских технологий.

Юлия Вдовина, директор по продукту цифровизации клиентского сервиса в дистанционных каналах компании BSS

Юлия Вдовина, директор по продукту цифровизации клиентского сервиса в дистанционных каналах компании BSS. Фото: BSS

Что касается выгод, с помощью речевой аналитики банки сегодня решают вопросы наращивания продаж: помимо повышения эффективности работы продавцов РА дает возможность улучшить сам продукт, получить обратную связь и информацию о том, что, например, «цепляет» клиентов у конкурентов, а также обогатить данные CRM-систем для более точного «попадания» в клиента.

Вторая область применения речевой аналитики — оптимизация затрат. На основании данных, полученных из канала РА, анализируются процессы обслуживания и продаж, временные потери, внутренний фрод.

Применение речевой аналитики в этой области дает возможность сократить затраты в среднем до 20%, а это немаловажно в текущих условиях развития бизнеса.

Дополнительно к сказанному отмечу, что РА позволяет работать с качеством обслуживания, формировать положительные клиентские впечатления и опыт.

Известно, что BSS апробировала решение по РА в отделениях банков. Для каких банков оно предназначено и есть ли какие-то ограничения по его внедрению и использованию?

Юлия Вдовина: РА в отделениях позволяет анализировать все диалоги сотрудников и посетителей, которые происходят в офисах обслуживания клиентов. Решение подходит для всех банков, ограничений нет. Сейчас речевая аналитика особенно востребована в банках, где уже идет или планируется цифровая трансформация. Ведь построение сети отделений будущего просто невозможно без знания клиента, а также без понимания собственных сотрудников.

Безусловно, здесь также акцент направлен на качественные продажи, освобождение сотрудников от рутинных операций, повышение общего настроя и создание бизнес-атмосферы у команд в отделениях.

Зачастую у наших заказчиков мы видим, как «закручивание гаек» в процессах, невыполнимые KPI и тому подобное приводят к тому, что сотрудник перестает чувствовать клиента, а процесс продажи сводится к сухому озвучиванию названий продуктов. Конечно, клиент в таком формате коммуникации вряд ли поймет, зачем ему продукт или услуга, а значит, и продажи в итоге не будет.

— В чем интерес и выгоды банка от использования РА в отделениях? Станет ли это таким же трендом, как использование РА в контакт-центрах банков?

Юлия Вдовина: Большей частью акцент делается на продажи. Отделение — это самая дорогая точка коммуникации клиента с банком, и ее надо использовать максимально эффективно. Для этого требуется вывести рутинные операции в каналы самообслуживания, а фокус активности персонала сместить на развитие отношений с клиентом, решение его сложных финансовых вопросов и т.д. В этом и состоит задача речевой аналитики.

Сейчас мы видим у многих банков интерес к данной технологии в отделениях и прогнозируем, что далее он будет возрастать.

Какое влияние оказывает РА в отделениях на клиентский опыт? Дополняет ли он информацию, получаемую в иных подразделениях банка?

Юлия Вдовина: Речевая аналитика вне зависимости от применения в точках физического или онлайн-присутствия помогает работать с клиентскими впечатлениями. Здесь и контроль качества обслуживания сотрудниками, и соблюдение стандартов качества компании, и отработка негативных кейсов, и сбор «болей» клиентов.

Если говорить о достаточности применения аналитики только в одном из каналов, то для выстраивания полноценной коммуникации с клиентом этого недостаточно. Необходимо понимать, что происходит в разных точках клиентского пути, «спрямляя» его. Это позволяет избежать волатильности в клиентском опыте, использовать синергию каналов коммуникации, выстраивать омниканальное взаимодействие только там, где это востребовано клиентами.

— Александр, чем ваше решение выделяется из ряда других? Есть ли аналоги на отечественном и мировом рынка?

Александр Крушинский: Мы используем полный стек собственных речевых технологий. Это распознавание устной речи (STT), NLU-технологии для семантического анализа диалога, инструментарий для анализа диалогов и формирования статистических отчетов. Кстати, все компоненты нашей платформы включены в реестр отечественного ПО Минцифры. Это речевая аналитика, диалоговые боты, включая голосовой и текстовый чат-боты, голосовая биометрия, база знаний.

Александр Крушинский, директор департамента голосовых цифровых технологий компании BSS

Александр Крушинский, директор департамента голосовых цифровых технологий компании BSS. Фото: BSS

Аналоги, конечно, есть, но мы концентрируемся на получении качественной стереорасшифровки диалога. Наша система учитывает и нюансы речи: интонацию, громкость напряжение голоса и прочее. Для успешного анализа критически важно понимать, какую реплику говорит сотрудник, а какую — клиент. Если с записями телефонных переговоров это не составляет проблемы (голосовые дорожки разделены по участникам), то при записи диалога в шумном офисе, когда сотрудник и клиент находятся близко друг от друга, разделение реплик — сложная техническая задача. Для ее решения используется комплекс продуктов — от направленных микрофонов до технологий по диаризации биометрическим признакам.

Юлия Вдовина: В нашем стеке уже нашла свое применение синергия РА и голосовых/ текстовых ассистентов, РА и голосовой биометрии.

В первом случае синергии РА и роботов речь идет об анализе эффективности робота. Можно определять, как клиенты воспринимают тексты робота, где они понятны, а где нет. Можно анализировать фразы, которые говорит клиент, для донастройки робота. Можно выяснять с помощью РА причины обращений и выстраивать их автоматизацию.

Во втором случае (синергия с голосовой биометрией) появляется возможность поиска всех голосовых записей одного клиента по голосу. Это, например, помогает бороться с фродом. При выявлении мошенника отбираются все записи с его голосом, чтобы определить, для каких клиентов возможны риски. Другой пример — работа над улучшением показателей метрики FCR (First Call Resolution). Выбираются все записи по одному клиенту и определяются причины повторных обращений.

Также мы не просто внедряем у заказчиков технологию — этим уже никого не удивить. В рамках контентного сопровождения наша команда развивает вместе с заказчиками их бизнес, оптимизирует затраты и улучшает клиентские впечатления. Наши аналитики делятся с заказчиком своим опытом, вместе с командами заказчика проверяют гипотезы, отрабатывают выводы, формируют портфели изменений, а также рассчитывают финансовые модели влияния на бизнес-показатели.

Что находится «под капотом» вашего решения? Расскажите подробнее, как был «придуман» и реализован весь комплекс РА в отделениях?

Александр Крушинский: Отсчет этой истории, наверное, стоит вести с 2019 года, когда было решено сделать свою систему речевой аналитики для контактных центров. На тот момент мы активно развивали решение для диалоговых ботов, у нас был качественный собственный «движок» распознавания речи, и речевая аналитика выглядела логичным вектором развития.

Собственно, «ядро» речевой аналитики — это подсистема STT (Speech To Text), которая отвечает за распознавание устной речи и перевод аудиозаписей в текстовые расшифровки. Мы еще умеем, как я сказал выше, различать нюансы речи. Но STT — это только фундамент. Для анализа диалогов недостаточно иметь их расшифровки: требуется инструментарий, который позволил бы анализировать диалоги по различным параметрам, начиная с простейших (например, среднего времени диалога) и заканчивая сложными проверками фраз оператора (например, нужные реплики в определенных местах диалога). А поскольку мы имеем дело с естественной речью, такой анализ должен учитывать вариативность реплик и опираться именно на смысл сказанного, а не только на жесткие шаблоны фраз. За поиск и анализ диалогов отвечают поисковый движок на базе (наиболее популярная поисковая система) и собственная Elasticsearch NLU-модель для анализа семантики.

Естественно, у каждого контакт-центра установлены разные правила обслуживания и соответственно разные критерии анализа. Значит, нужен развитый инструментарий, который позволил бы сотрудникам контакт-центра настраивать правила контроля и формировать различные формы статистических отчетов. Основные наши усилия в это время были направлены именно на то, чтобы найти баланс между гибкостью и удобством настройки.

В 2020 году мы представили наше решение, которое понравилось рынку, и у нас пошли первые внедрения, а в 2021-м к нам обратился один из наших крупных клиентов с просьбой реализовать решение для офисов обслуживания. Тогда мы еще не работали с микрофонными системами, но понимали, что контроль качества неизбежно выйдет за пределы контакт-центров. У нас уже была отличная RnD-команда, был опыт работы с языковыми нейросетями, и мы приняли этот вызов.

Анализ разговоров в офисах поставил перед нами несколько серьезных задач. Первое, с чего мы начали, — это подбор микрофонов. Сразу отказались от идеи записи в монорежиме, так как это не позволило бы разделить каналы клиента и сотрудника. Нам требовались направленные микрофоны с возможностью настройки кардиоиды (фиксирования направленного звука перед микрофоном и подавления звуков сбоку и сзади) и чувствительности. Мы перепробовали массу вариантов — от недорогих китайских девайсов до журналистских узконаправленных микрофонов. Остановились на российских микрофонах, которые оказались оптимальными по соотношению цена — качество.

Следующей серьезной задачей стала адаптация модели распознавания. В отличие от телефонного канала, при записи с микрофонов подсистеме распознавания приходится работать в сложнейших акустических условиях: шум речи от соседних столов, объявления по громкой связи, звук клавиатуры, проникновение звука из другого канала (когда в микрофон, который регистрирует речь клиента, попадает голос сотрудника, и наоборот) и т.д.

Для обучения такой модели пришлось создать огромный датасет (сотни часов в различных акустических условиях), затем в несколько итераций подобрать архитектуру нейросети и дообучить модель распознавания в микрофонном канале.

Остальное было делом техники: мы подготовили интеграционную подсистему для сбора метаданных, придумали и реализовали схему подключения микрофонов напрямую через USB-порт АРМа сотрудника, «нарезали» записи по данным электронной очереди.

В результате удалось сформировать комплексное решение, которое пишет качественное стерео, умеет распознавать речь в шумной обстановке с WER (Word Error Rate) менее 15%, работает в закрытом контуре заказчика, не требуя ни графических процессоров в ЦОД заказчика, ни облачных вычислений.

Это решение является коробочным? Требуется ли дальнейшая совместная работа команд банк и вендора по донастройке моделей и т.д.? Как происходит это взаимодействие?

Александр Крушинский: Мы поставляем коробочное решение, которое требует необходимого минимума работ для запуска. В текущую «коробку» входят: модель распознавания, обученная на диалогах с использованием микрофонов в сложной акустической обстановке, преднастроенные метрики и статистические отчеты, микрофоны, а также интеграционный сервер, который занимается сбором аудио с микрофонов и обогащением их данными из учетных систем заказчика.

Конечно, как и при внедрении любой промышленной системы, требуются работы по интеграции и настройке решения. Обычно внедрение включает в себя несколько этапов.

Во-первых, интеграция с системами заказчика. Необходимый минимум — это интеграция с расписанием сотрудников, для того чтобы понимать, кто каким микрофоном пользуется, а также интеграция с электронной очередью, которая нужна для «нарезки» десятичасовой записи на отдельные диалоги, соответствующие сеансам обслуживания. Причем от взаимодействия с электронной очередью можно вовсе уйти, если использовать ToF-камеры, которые «видят» клиента, который сел на стул, и автоматически дают команду на старт записи.

На этом этапе совместно работают наша инженерная команда и инженеры заказчика. Обычно здесь каких-то нетривиальных проблем не возникает. У BSS 30-летний опыт внедрений в банках и крупных контакт-центрах, поэтому интеграция — привычный и отлаженный бизнес-процесс.

Далее идет настройка метрик и отчетов. На этом этапе подключается команда наших аналитиков, которая совместно с аналитиками и контролерами качества заказчика, определяет метрики контроля и настраивает автоматический сбор метрик, а также вывод их в отчетность. В команде речевой аналитики работают люди с практическим опытом работы в крупных контакт-центрах, поэтому мы можем не только настроить речевую аналитику под процессы заказчика, но и помочь с организацией самого процесса.

Наконец, последний этап — дообучение модели распознавания под специфическую лексику заказчика, например под локальные термины и названия продуктов. Для этого обычно достаточно 5–10 часов аудио, которое мы используем для дообучения моделей. Сам процесс не требует от заказчика никаких усилий, но часто возникают сложности с передачей нам аудиозаписей из-за требований информационной безопасности.

Существуют несколько подходов, которые позволяют обойти эту проблему. Во-первых, мы можем деперсонализировать аудио, взяв только тот аудиоматериал, который не содержит персональных данных и другой чувствительной информации. Во-вторых, если нам нужно научить модель распознавать конечный перечень терминов и слов, мы можем самостоятельно записать «синтетические» аудио и обучиться на них. Наконец, существует возможность развернуть внутри IT-периметра заказчика инструментарий для обучения нейросети, но для этого уже потребуются серверы с GPU-картами.

Какой дополнительный опыт получает клиент, посещая банк, в отделениях которого развернута эта платформа? Нет ли здесь противоречия с утверждениями некоторых банков отом, что отделения должны «отмереть»?

Юлия Вдовина: Здесь можно говорить о предоставлении более качественного обслуживания.

Во-первых, обслуживание предоставляется в соответствии со стандартами качества компании. При этом банк будет слышать обратную связь от клиента и иметь возможность перестроить обслуживание под его потребности. Во-вторых, в этих отделениях клиенту предложат продукты, исходя из потребностей, не будет. В процессе продажи клиенту будут описаны все бенифиты и выгоды от использования продукта, проведен качественный онбординг. Мисселинга. И, безусловно, обслуживание будет происходить быстрее.

При этом главное — помнить, что использование речевой аналитики требует каждодневной работы с ней на местах. Без этого эффекта ни для клиента, ни для бизнеса не будет.

Что же касается «отмирания» офисов, то рынок уже убедился, что данная теория несостоятельна. В нашей стране люди не особенно доверяют банкам, у которых нет точек физического присутствия. Но вот офисы привычного формата действительно уходят в прошлое, а на их место приходит новый формат точек, куда люди приходят не только за решением финансовых вопросов, но и для общения, работы, получения новых знаний. Совершенно логично, что такой новый формат взаимодействия сулит множество инсайтов для банков, которые научатся оцифровывать, обрабатывать и использовать получаемые данные.

Какие меры ИБ должны быть использованы для сохранности биометрических данных клиентов в отделениях? Требуется ли согласие клиента?

Александр Крушинский: Биометрические образцы при записи не собираются, поэтому согласия на их сбор не требуется. Единого мнения по поводу необходимости согласия на саму запись у наших заказчиков нет. Кто-то считает, что согласия не требуется вообще, кто-то считает, что достаточно устного согласия. Какой-то более сложной формы согласия в любом случае не нужно, так же как оно не требуется для записи телефонных разговоров с банком, а они практически всегда пишутся.

Все компоненты нашего решения размещаются в контуре заказчика. Таким образом, чувствительные данные за периметр его IT- системы не выходят. И, конечно, применяются все стандартные способы защиты, включая гибкое распределение прав, шифрование данных и усиленную авторизацию пользователей.

Можно ли использовать преднастроенные модели, уже применяемые в банках, например в контакт-центре?

Александр Крушинский: Если говорить про модели речевой аналитики в отделениях, то скорее нет, чем да. Дело в том, что микрофонный канал очень сильно отличается от телефонного по акустическим условиям. Поэтому проще и правильнее для контакт-центра использовать свою модель, адаптированную именно под телефонный канал. При этом модели распознавания телефонной речевой аналитики отлично подойдут для голосового бота, и обучать модель «с нуля» не требуется. У нас есть уже предобученные модели под микрофоны в отделениях и специальные предобученные модели под телефонный канал. Причем мы обучаем и поставляем отраслевые версии таких моделей: у нас есть отдельные модели под лексику финансового сектора, для медицинских контакт-центров и т.д.

— Какова сейчас ситуация с кадрами, готовыми осуществлять поддержку и развитие системы как у вендора, так и у клиентов?

Александр Крушинский: Конечно, для разработки продуктов в наукоемкой области речевых технологий требуются высококвалифицированные разработчики и дата- саентисты. Это всегда дефицитный, а иногда уникальный ресурс. Поэтому перед нами стоит задача — сделать так, чтобы наши продукты не требовали от заказчика найма каких-то специальных сотрудников дефицитных профессий.

Если говорить про речевую аналитику, то решение ориентировано на то, чтобы настройку отчетов, метрик, оценочных форм и дообучение нейросетевых моделей могли выполнять даже не IT-специалисты, а контролеры качества — аналитики заказчика. В наших командах внедрения настройкой моделей также занимаются люди с опытом прежде всего в клиентском обслуживании, а не с каким-то специфическим опытом в IT.






Новости Релизы