Банковское обозрение

Финансовая сфера

  • Три кита успешной работы с «большими данными»
15.05.2013
Три кита успешной работы с «большими данными»

Спрос на технологии работы с «большими данными» формируют крупные компании и организации, решающие масштабные задачи взаимодействия с многочисленными клиентами. Для таких организаций особенно актуальны задачи анализа, категоризации и хранения больших объемов данных, причем решать их можно уже сегодня



На глобальном уровне можно выделить три основные функциональные задачи системы по работе с «большими данными» — хранение, категоризация и мониторинг информации. Мы предлагаем решать их в рамках внедрения единой системы, контролирующей все информационные потоки на предприятии. Именно такая концепция реализована в InfoWatch Traffic Monitor Enterprise — комплексное решение включает в себя хранилище данных, а также технологии анализа, категоризации и мониторинга информации.

Хранение. Система InfoWatch Traffic Monitor Enterprise фиксирует всю активность сотрудников компании, касающуюся работы с информацией, и отправляет данные о ней в хранилище InfoWatch Forensic Storage, где они доступны для ретроспективного анализа. В режиме реального времени в данном хранилище накапливается архив пересылаемых сотрудниками почтовых сообщений, данные, которые сотрудники публикуют в Интернете с помощью web-сервисов со своих рабочих мест, а также передают через системы мгновенного обмена сообщениями и социальные сети.

Категоризация. InfoWatch Traffic Monitor Enterprise использует комплекс различных технологий для обработки и анализа данных. Информация может быть систематизирована и категоризирована посредством применения технологий лингвистического анализа, цифровых отпечатков и анализа тестовых шаблонов. Совокупное применение нескольких технологий позволяет с максимальной точностью находить конфиденциальные данные в общем хранилище неструктурированной информации, определять тип и тематику информации.

Мониторинг. За реализацию мониторинга отвечает элемент системы InfoWatch Traffic Monitor Enterprise под названием InfoWatch Crawler. Он контролирует, какая информация хранится в общедоступных сетевых хранилищах и системах документооборота, осуществляет сканирование и применение политик к информации, хранящейся «в покое». Поиск может осуществляться в базе данных, системе документооборота и сети машин Windows, в том числе на их локальных дисках. Для найденных файлов определяется список учетных записей пользователей, которые имеют к ним доступ. Эти файлы также обрабатываются InfoWatch Traffic Monitor Enterprise: выполняется контентный анализ с использованием уже упомянутых технологий лингвистического анализа, цифровых отпечатков и анализа шаблонов. Далее к файлам применяется политика InfoWatch Traffic Monitor Enterprise, установленная в организации.

Итоги и выводы. Большие объемы данных, имеющиеся в современных компаниях, требуют, с одной стороны, хранения, а с другой — кропотливого анализа с целью ответить на вопросы: «Где лежит информация того или иного типа? Кто имеет доступ к этой информации? Как оперативно найти ту или иную информацию определенного типа?» и т.д.

При должной настройке с привлечением заинтересованных бизнес-подразделений и специалистов по внедрению, DLP-систему можно успешно «повернуть» в сторону обработки «больших данных» так, чтобы она дала ответы на вопросы, поставленные выше. Эти ответы позволят сделать информацию более доступной и обеспечить ее грамотное использование в рамках ведения бизнеса, а это немало, ибо информация в наш век — это и товар, и деньги, и конкурентное преимущество.



Читайте наши лучшие материалы Яндекс. Дзен Телеграмм

Присоединяйся к нам в телеграмм