Вход Регистрация
Подписка
Новости Войти в раздел

Big Data на службе Альфа-Банка

Технологии Big Data в банковском секторе не только нашли свое место, но и доказали экономическую эффективность. Обозреватель «Б.О» Вадим Ференец обсудил результаты проектов с Ириной Елистратовой, главным директором Центра BI Альфа-Банка, и Андреем Пивоваровым, руководителем группы перспективных технологий предпроектного консалтинга Oracle СНГ

Слева направо: Вадим Ференец («Б.О»), Ирина Елистратова (Альфа-Банка) и Андрей Пивоваров (Oracle СНГ)

 

Вадим Ференец: Как Oracle и Альфа-Банк видят и оценивают технологию, которую сейчас принято называть Big Data? Откуда она появилась, какие у нее плюсы и минусы применительно к финансовой сфере? Андрей, вам первое слово!

Андрей Пивоваров: Под термином Big Data разные организации и разные люди могут понимать совершенно разное. На Big Data можно смотреть как с точки зрения возможностей технологии, так и с позиций набора концепций обработки данных.

Сейчас существует необходимость хранить и обрабатывать данные как в традиционных реляционных хранилищах, так и в иных форматах, которые выбираются исходя из особенностей хранимой информации и областей ее применения в бизнесе. Одной из лучших мировых практик при этом является использование специализированных комплексов, которые имеют ряд существенных преимуществ.

У Oracle есть целое семейство оптимизированных программно-аппаратных комплексов Oracle Engineered Systems, которое включает в себя в том числе интегрированную систему для работы с «большими данными» — Oracle Big Data Appliance, а также специализированные «машины баз данных» Oracle Exadata. В первом случае оборудование «заточено» на работу с неструктурированными данными, во втором — с реляционными базами данных. И то, и другое успешно используется в Альфа-Банке.

При создании таких комплексов Oracle старается решить несколько задач. Назову две из них. Во-первых, это достижение максимально возможной производительности за счет тщательного проектирования, подбора компонентов, настройки программного обеспечения (ПО), комплектации решения функциональностью и, конечно, оптимизации. Это возможно только в том случае, если и аппаратные, и программные системы проектируются, тестируются и отлаживаются совместно. Вторая задача — обеспечение надежности. Об этом можно говорить очень долго, но, например, работа со стандартными конфигурациями увеличивает вероятность выявления потенциальных проблем или выбор решения, так как часто та или иная проблема уже возникала у других клиентов и был найден эффективный путь ее преодоления,.

Ирина Елистратова: Я бы называла термином Big Data не столько появившиеся на рынке новые технологии хранения и обработки больших данных (Например, Hadoop), сколько создание и успешное взаимодействие четырех компонентов:

  1. Развитие технологических платформ и решений, отвечающих за консолидацию данных: а) системы Master Data Management («золотая запись» MDM клиента, MDM продукта и т.д); б) развитие технологий классических хранилищ данных (DWH, например, технологии Oracle Exadata), которые собирают и агрегируют большие объемы структурированных данных, рассчитывают различные аналитические показали и делают это достаточно эффективно; в) развитие класса решений Hadoop — в нашем случае это комплекс Oracle Big Data Appliance для работы со структурированными и неструктурированным данными очень большого объема. Комбинированный подход использования данных технологий в процессах сбора, хранения анализа и обработки данных снимает большое количество ограничений в реализации идей и гипотез, которые ранее могли возникать только на уровне фантазий аналитика.
  2. Развитие инструментов анализа, моделирования и визуализации данных, которые позволяют превращать их в аналитику и побуждать к выводам и действиям на основании новых знаний.
  3. Отбор и развитие людей, профессионалов в этой области работы с данными: аналитиков по данным, data scientists, исследователей данных. Именно эти специалисты знают, как помочь бизнесу при помощи BI, Big Data, машинного обучения и искусственного интеллекта заработать дополнительную прибыль.
  4. Главный компонент в этой четверке — появление новой культы работы с данными, встраивание аналитики во все ключевые процессы организации.

Вадим Ференец: Ирина, вы упомянули о прибыли от «больших данных». Не приоткроете ли некоторые подробности, как ее можно получить?

Ирина Елистратова: Выявить отдельный финансовый эффект от внедрения Big Data достаточно сложно, получение прибыли — это результат успешного сочетания различных фактов: правильной стратегии Банка, амбициозности и вовлеченности каждого сотрудника в команде, технологичности платформ, хорошего знания своих клиентов, удобства и актуальности предлагаемых сервисов и продуктов для клиента и т.д.

Я бы сравнила знание профиля клиента с «лучом света» — такая своеобразная визуализация. Что-то нам изначально известно о клиенте из его анкеты, какую-то информацию Банк получает в момент заключения договора, далее в процессе обслуживания базовая информация дополняется и актуализируется (представьте — это как стержень «луча света»). А вот использование Big Data и различных аналитических инструментов позволяет объединить всю информацию из дополнительных источников. Например, можно обогатить базовый банковский клиентский профиль данными об интересах клиента, его покупательских предпочтениях, путешествиях и т.д., таким образом сильно расширив знания о клиенте за счет понимания его жизни и поведения за периметром банка. В итоге длина «луча» растет, появляются новые секторы, являющиеся результатом обработки данных о клиенте из разных источников. Со временем длина «луча» будет увеличиваться и более точно отражать накопленный клиентский опыт. Это позволяет строить прогнозы вплоть до предсказания поведения определенных групп людей со схожими жизненными характеристиками.

Но каждому продукту — свое время. Лет пятьдесят назад кассир продовольственного магазина знал каждого покупателя в лицо и понимал, что, например, этот клиент молоко здесь не берет, потому что бабушка из соседней деревни снабжает его парным молоком и творогом. Но вот во времена массового обслуживания клиентов и «уберизации» этого процесса так уже не получается.

Вадим Ференец: Ирина, тем не менее технологии Big Data в Альфа-Банке изначально появились для решения других задач. Каких?

Ирина Елистратова: Да, верно. В Альфа-Банке начали думать о новых технологиях в 2013 году. Точнее, даже не так. Думать, читать, узнавать, что нового в мире, мы начали в 2012-м, а в 2013 году мы уже пилотировали новые технологии, предлагаемые различными вендорами. У нас была конкретная задача по выполнению требований регулятора, поэтому нам четко были известны критерии успешности «пилотов». Анализ имеющихся в периметре Банка задач, результаты «пилотов», оценка стоимости реализации задачи на существующих платформах и понимание стоимости и перспектив в будущем, привели нас к твердому пониманию того, что без «больших данных» нам не обойтись. Это говорит о том, что к Big Data мы пришли не по веянию моды, а исходя из конкретных кейсов.

Вадим Ференец: А какие регуляторные вопросы можно решить с помощью технологий Big Data?

Ирина Елистратова: В определенный момент Альфа-Банк вступил в программу внедрения стандартов Базельского комитета, в частности по выполнению требований по достаточности капитала. Чтобы выполнить эти требования, необходимо оценить каждого клиента, каждую его сделку на склонность к риску и возможность дефолта по определенной модели. Данные для програмы должны быть получены и изучены на «глубину» десять лет. В Альфа-Банке сейчас около 10 млн клиентов-физлиц. Для моделирования необходим анализ всех заявок клиента, которые он подавал в Банк. В итоге на одного клиента в его досье может быть пять, десять и более кредитных заявок. Складываем, умножаем…

Кроме того, необходимо учитывать нагрузку, создаваемую проводимым регулятором аудитом, в рамках которого он может спросить: «Почему у вас модель отработала на этом массиве клиентов именно так и выдала такой-то показатель? Покажите исходные данные по запросу и поясните, почему вы приняли такое-то решение».

Что позволяет делать решение Oracle Big Data Appliance? Помимо сокращения затрат на дисковые пространства (которые потребовались бы при хранении подобного массива данных в классическом DWH), уменьшения скорости доступа к глубокой истории и получения удобства работы с данными Oracle Big Data Appliance позволяет достаточно гибко регулировать структуру файлов по полям, если она меняется в разных кредитных продуктах или со временем. После решения задачи, связанной с «Базелем», у нас нет ограничений с пилотированием и развертыванием других бизнес-задач, например, связанных с получением углубленной клиентской аналитики. Это один из примеров, когда инвестиции в технологии для поддержки требований регулятора стали драйвером развития технологий Big Data для разных областей в Альфа-Банке.

Вадим Ференец: Андрей, существует мнение, что программно-аппаратные комплексы в условиях быстрого развития IT не отвечают инвестициям. Трудно проводить обновление ПО? Что делать, если надо добавить новое «железо»: заменять старое новым?

Андрей Пивоваров: Это сильное преувеличение. Примерно раз в год-полтора у нас выходят новое поколение оборудования; раз в несколько месяцев появляется новая версия или обновление программного обеспечения. Большинство программно-аппаратных комплексов Oracle позволяют сосуществовать нескольким поколениям: мы можем взять комплекс Exadata, который выпущен три или четыре года назад и без проблем подключить к нему еще одну аппаратную систему, выпущенную, допустим, в этом году. И они будут совместимы. Что касается обновлений программной части на машинах прошлых поколений, то этому ничего не мешает, это касается программного обеспечения как от Oracle, так и от третьих сторон, например Hadoop.

Вадим Ференец: Ирина, давайте в финале вспомним о людях. Когда компаниям, выбравшим Big Data и другие продвинутые аналитические технологии, могут понадобиться data scientists?

Ирина Елистратова: Это глубоко философская проблема, она сродни вопросу о первичности курицы или яйца. Невозможно полноценно применять новые технологии без соответствующих специалистов, и нет способов получения нужных компетенций без практического использования Big Data на пользу организации — будь то рост бизнеса или исполнение требований регулятора.

С моей точки зрения, ответ находится в другой плоскости: когда в организации начинает остро ощущаться нехватка способов получения доходов известным привычным способом, появляется созревшая и осознанная бизнес-потребность. В этот момент технология «выстреливает», но с кадрами, как, впрочем, и всегда, будет какое-то время проблема, которая по мере продвижения и развития этой темы будет решаться. Люди растут, учатся. Востребованная ниша достаточно быстро заполнится и в России.



Эта статья была разослана 1190 on-line подписчикам bosfera.ru
Выбор редакции
Real-time аналитика и Business intelligence (BI) в банке Были времена, когда BI была нужна в финансовой сфере, главным образом, для перевода необработанной информации, собранной внутри организации, в осмысленную, удобную для восприятия человеком форму....
12.03.2017
Материалы альянса финансовых медиа:
Разговоры финансистов

закрыть