Финансовая сфера

Банковское обозрение


  • Неструктурированными данными управлять сложнее всего
01.03.2012

Неструктурированными данными управлять сложнее всего

При больших объемах данных производительность серверов может деградировать, растет время резервного копирования, затраты на его обеспечение существенно увеличиваются (хранение данных в нескольких экземплярах), что требует внедрения дополнительных технологий, ускоряющих эти процессы


Неструктурированными данными (офисные документы, графические и т.д.) управлять сложнее всего. Объемы этой информации составляют 50–85% от всех данных организации, а рост объемов достигает 100% каждые 2–3 года. Хранение этой информации доставляет максимум сложностей. Как правило, это тысячи, а то и миллионы файлов небольшого размера. Соответственно, могут возникать большие вопросы с резервным копированием, так как зачастую резервирование происходит пофайлово и вне зависимости от мощности серверов и быстродействия систем хранения данных, скорость резервирования данных не превышает 10–20 Мб/сек.

Общий список проблем:

• Сложности с резервным копированием при больших объемах;

• Невозможность управления ростом объемов;

• Множество вопросов с безопасностью хранения, так как эти данные зачастую содержат персональные данные и конфиденциальную информацию.

На сегодняшний день на рынке существует множество систем архивирования, позволяющих существенно оптимизировать хранение данных электронной почты и данных на файловых серверах. В России и странах СНГ доступны как минимум Symantec Enterprise Vault, EMC SourceOne , CommVault и другие. Первые два — программные, а EMC SourceOne больше ориентирован на применение совместно с системой хранения EMC Centera.

Большинство систем архивирования представляют собой набор технологий, позволяющих:

• уменьшить рост объемов за счет применения ILM, которые позволяют регламентировать время хранения на основании множества политик;

• сократить стоимость хранения данных за счет автоматизированного переноса на более недорогие уровни хранения (диски SATA, ленты и другие);

• уменьшить занимаемые объемы за счет применения компрессии (до 20% экономии) и дедупликации (до 80% экономии на уровне объектов хранения и/или поблочной);

• eDiscovery Compliance: контекстное индексирование данных архива и последующий поиск;

• штатную доступность данных для пользователей даже после переноса в архив на отдельные носители.

Выбор конкретной системы архивирования, включающей функции управления жизненным циклом информации (Information Lifecycle Management, ILM), зависит от многих факторов: возможностей и требований заказчика, систем, подлежащих архивированию и других. Естественно, универсального продукта на все случаи жизни, к счастью или сожалению, как обычно, не существует.

Обычно проект по внедрению системы архивирования (в том числе ILM) состоит из двух больших частей:

• пилотный проект (клонирование существующих объемов, отладка политик архивирования и ILM, протоколирование сценария внедрения, оптимизация быстродействия, миграции данных, оценка эффективности и многое другое);

• непосредственно внедрение, полностью базирующееся на документации, полученной на стадии «пилота».

ROI от внедрения подобной системы состоит по меньшей мере из следующих компонентов: уменьшение стоимости хранения, объемов хранения и их роста, сокращение затрат на резервное копирование, уменьшение операционных затрат, оценка уменьшения бизнес-рисков от внедрения eDiscovery Compliance.






Новости Новости Релизы
Сейчас на главной

ПЕРЕЙТИ НА ГЛАВНУЮ