Byte/RE ИТ-издание

Как хранить архив десятилетиями

Юлия Воронова
компания "Электронный Архив"

В век информационных технологий понятие "архив" все чаще подразумевает не пыльные стеллажи, забитые документацией, а электронные данные, которые необходимо хранить в течение длительного времени. Быстрорастущие потребности компаний в современных средствах архивного хранения стимулируют стремительное развитие новых технологий и требований к ним.

Несмотря на то, что профессиональные системы хранения данных на предприятиях сегодня стали необходимостью, с сожалением приходится констатировать: далеко не всегда в нашей стране способ хранения той или иной информации соответствует реальным требованиям. Для того, чтобы дорогостоящее оборудование и ПО отвечали потребностям компании, необходимо четко разделять задачи хранения данных.

Задачи хранения данных

В последние годы широкое распространение получила теория управления жизненным циклом информации, в основе которой лежит принцип разделения общего массива данных на классы в зависимости от содержания, частоты обращений к ним и срока хранения. В соответствии с этим подходом сформировались три ключевые задачи хранения электронных данных: это онлайновый доступ к данным, резервное копирование и архивное хранение данных. Для решения каждой из этих задач применяется различное оборудование, учитывающее специфические требования к особенностям хранения и доступа.

В этой статье мы не будем подробно останавливаться на первых двух задачах, а постараемся более подробно рассказать об архивном хранении данных.

Онлайновый доступ к данным

Типичным примером этой задачи можно назвать файловый сервер: множество пользователей корпоративной сети должны получать необходимые данные мгновенно. Основные требования к подобным системам — непрерывность доступа и высокая скорость работы. Исходя из них, можно заключить, что идеальным вариантом организации онлайнового доступа к данным будет RAID-массив.

Резервное копирование

Второй тип хранения — сохранение резервных копий данных подразумевает высокую потоковую скорость записи и чтения и высокую емкость носителя, вмещающего резервную копию данных со всех серверов корпоративной сети. Долговечность хранения в данном случае не имеет значения, так как резервное копирование — процедура регулярная, проводится как минимум раз в месяц. Для решения этой задачи оптимальным выбором будут системы на основе ленточных накопителей.

Архивное хранение

В отличие от двух предыдущих, эта задача предполагает сохранение важной информации в течение длительного времени и обеспечение оперативного доступа к ней. Это диктует вполне определенные требования к технологиям хранения и оборудованию. Первое и самое важное требование — исключить физическую возможность удаления или изменения данных, как по неосторожности, так и по злому умыслу. Таким образом, информационный носитель должен отвечать требованиям спецификации TRUE WORM (True Write Once Read Many), т. е. защита данных от удаления должна быть не программной, а аппаратной.

К ключевым особенностям архивного хранения специалисты также относят долговечность хранения и высокую емкость носителя, что существенно снижает совокупную стоимость владения системой (TCO) и позволяет удовлетворить запросы к объему данных даже очень крупных предприятий, в том числе государственного и промышленного сектора.

Из этих требований следует, что ни RAID-массивы, ни ленточные накопители не могут справиться с задачей архивного хранения данных в силу своих технологических особенностей. Несмотря на это, в России в настоящее время большая часть информации хранится на жестких дисках или RAID-массивах. Жестким дискам доверяют даже информацию, которая по ряду причин требует долговечного и надежного хранения. Но сам принцип работы жесткого диска подразумевает постоянное механическое движение. Данные "крутятся" на магнитном диске в течение всего срока их хранения, что не может не приводить к сбоям в работе устройства и периодическим потерям информации. Никаких гарантий работоспособности жесткого диска в течение десятилетий производители не дают. Ирония заключается в том, что, доверяя самые ценные данные RAID-массивам, мы забываем, что технология RAID была создана именно по причине ненадежности и недолговечности жесткого диска.

Сходные проблемы возникают и при попытке построить архивное хранилище данных на основе ленточных накопителей. Недолговечный носитель информации вынуждает периодически проводить процедуру переноса данных со старой ленты на новую. Кроме того, лента нуждается в обслуживании — если она не используется, ее необходимо регулярно перематывать, чтобы не допустить размагничивания. У этой технологии есть минусы и в использовании — получить доступ к произвольному файлу на ленте невозможно, для этого ее приходится перематывать в процессе поиска нужной информации.

Для решения задачи архивного хранения данных в соответствии с требованиями
рынка был разработан новый класс специализированных устройств — архивные накопители.
Это роботизированные библиотеки оптических дисков, управляемые специальным ПО,
которые позволяют построить надежную систему хранения и автоматического управления
жизненным циклом данных. Уже сейчас в России работает около трехсот архивных
накопителей ЭЛАР НСМ, основанных на проверенной DVD-технологии. Коммерческие
и государственные организации применяют их для обеспечения сохранности различных
данных, среди которых электронные документы, корпоративные архивы электронной
почты, видео- и аудиоданные, результаты исследований, данные о финансовых операциях
и т. д. Корпорация "Электронный Архив" (http://www.elar.ru)
действует в качестве российского Центра компетенции по архивному хранению данных,
будучи также эксклюзивным представителем производителей систем архивного хранения
данных.

Интересный факт — за 10 лет работы этих накопителей в России не было ни одного случая выхода из строя роботизированного механизма. Но даже если бы это и произошло, DVD-диски, на которых хранится информация, остались бы исправными и готовыми к дальнейшей работе.

Развитие технологий хранения

К началу нынешнего столетия технология DVD по объемам хранения достигла уровня
9,4 Гбайт на носитель, а в настоящее время появляются еще более совершенные
технологии, основанные на использовании "голубого" лазера. В 2000 г. мировые
ИТ-гиганты Hewlett-Packard (http://www.hp.com)
и Sony (http://www.sony.net) совместно с производителем
профессиональных оптических библиотек Plasmon Data (http://www.plasmon.co.uk)
решили разработать новый стандарт оптического диска, который пришел бы на смену
хорошо зарекомендовавшей себя в прошлом магнитооптической технологии. Компания
Plasmon, уже завоевавшая к 2000 г. мировое лидерство на рынке автоматизированных
систем хранения данных на основе DVD и магнитооптики, инвестировала значительные
средства в разработку нового поколения оптических дисков, получивших название
UDO (Ultra Density Optical).

Главное отличие новой технологии заключается в использовании лазера, имеющего меньшую длину волны — 405 нм вместо 650 нм у красного лазера, который применяется в CD- и DVD-приводах (рис. 1). Способность привода прожигать большее число меток на единицу поверхности специального покрытия обеспечивает на порядок большую плотность записи и соответственно резкое увеличение емкости носителя. Однако это лишь первый этап. В настоящий момент компания Plasmon анонсировала первое поколение UDO-носителей, емкость которых составляет 30 Гбайт. Но уже сейчас в плане производства на 2005 г. стоят диски объемом 60 Гбайт, а на 2006 г. — 120 Гбайт. Стоит отметить, что все поколения UDO будут обратно совместимы.

Fig.1 Рис. 1. Технологические различия между CD-, DVD/MO- и UDO-приводами.


Новая технология создавалась специально для решения задачи архивного хранения данных с учетом опыта использования DVD и магнитооптики. Разработчикам удалось построить технологию UDO, избежав существенных минусов ее предшественников — запись на носитель происходит без участия магнитного поля и без физического контакта привода с рабочей поверхностью диска. Именно поэтому записывающий слой носителя не деградирует с течением времени, невосприимчив к магнитным полям и менее чувствителен к перепадам температуры и влажности по сравнению с другими устройствами хранения данных. Тестирование UDO-носителей с целью определения максимальной продолжительности их жизни, а следовательно, и возможности считывания данных, проводилось на основе общепринятых лабораторных методик. Результаты показали, что можно считать гарантированным как минимум 50-летний срок хранения данных при соблюдении нормальных условий окружающей среды. Таким образом, специализированная задача архивного хранения данных переходит в новую фазу своего развития: от массового стандарта DVD к профессиональному стандарту UDO.

Новые архивные накопители UDO (рис. 2) соответствуют всем требованиям, предъявляемым к долговременному и надежному хранению информации:

  • поддержка спецификации TRUE WORM реализована на физическом уровне, так как в процессе записи происходит необратимое изменение агрегатного состояния вещества;
  • емкость одного носителя уже составляет 30 Гбайт, чему нет аналогов среди оптических дисков. Это позволяет уже сегодня создавать хранилища данных емкостью до 20 Тбайт на одно устройство и наращивать их при необходимости;
  • UDO-технология обеспечивает произвольный доступ к данным. Немаловажное ее достоинство — такая же скорость позиционирования лазерной головки на диске, что и у жестких дисков.
Fig.2 Рис. 2. Архивные накопители на основе технологии UDO.


Совокупная емкость проданных по всему миру UDO-накопителей уже превысила 2 Пбайт. Среди мировых пользователей этих накопителей — такие известные компании, как Deutsche Bank, BMW Italia, Goodyear Dunlop Tyres, Airbus и т. д.

Как используют архивные накопители

Список областей применения архивных накопителей постоянно растет. Несмотря на то, что архивные накопители получили широкое распространение относительно недавно, в системах хранения крупных компаний они уже заняли свое место.

Интегрированное хранилище данных предприятия

Весьма перспективный вариант использования архивных накопителей — организация корпоративного хранилища данных. Концепция HSM (Hierarchical Storage Management) подразумевает перемещение редко используемых данных с быстрых и дорогих накопителей на жестких дисках на дешевые вторичные накопители, с сохранением оперативного доступа ко всей информации. На архивные накопители перемещают с RAID-массивов только те данные, которые предназначены для долговременного хранения. Схема организации такого корпоративного хранилища данных показана на рис. 3.

Fig.3 Рис. 3. Схема организации корпоративного хранилища данных с учетом концепции HSM.


Создание интегрированного ресурса на основе единой системы управления обеспечивает требуемый уровень управляемости, масштабирования и надежности хранения. Помимо этого, есть и существенная экономическая выгода. Дело в том, что типовое решение проблемы постоянного роста данных — за счет подключения к серверам новых RAID-массивов при ближайшем рассмотрении оказывается непомерно дорогим, причем стоимость приобретения нового RAID-массива — лишь одна из нескольких составляющих всех затрат. Системному администратору постоянно приходится разбираться в структуре хранимой информации, выделять пассивную часть и проводить очистку дискового пространства. Согласно аналитическим исследованиям, затраты на управление и обслуживание первичных накопителей в пять раз превышают затраты на их приобретение. Другая составляющая затрат связана с необходимостью организации систематического резервного копирования всего объема данных RAID-массивов. Поэтому при постоянном росте объема хранимой информации архивный накопитель на оптических дисках обходится гораздо дешевле, чем увеличение объема RAID-массива.

Аналогичное решение реализовано для организации долговременного хранения информации федерального уровня в налоговой службе Российской Федерации.

Зеркалирование RAID-массива на библиотеку

Это сравнительно новая сфера использования архивных накопителей. Компания Qstar
(http://www.qstar.com), разработчик ПО для
архивного хранения данных, анонсировала на CeBIT 2005 поддержку этой технологии
в своем продукте Data Director. Суть технологии зеркалирования состоит в переносе
всех изменений файловой системы RAID-массива на архивный накопитель в режиме
реального времени. Такая система обеспечит гарантированную сохранность данных
на жестких дисках. Таким образом, налицо попытка организации системы резервного
копирования на основе архивных накопителей.

Архив видео- и аудиоданных

Сегодня все больше компаний, которым требуется хранить видео- и аудиоданные, доверяют их архивным накопителям. Очевидный плюс подобного решения — сверхбольшая емкость оптических дисков, позволяющая хранить видеоданные телевизионного качества, и гарантия сохранности информации. Крупные телерадиокомпании (к примеру, итальянская RAI и германская ZDF) уже оценили все преимущества решений на основе "голубого лазера" и в настоящее время переводят свои данные на архивные накопители. В General Electric на оптических дисках хранят корпоративный архив видеонаблюдения.

В штаб-квартире Всемирной торговой организации (ВТО) в Женеве все переговоры участников, которые ведутся в восьми конференц-залах на восьми языках, хранятся на архивном DVD-накопителе. Аудиоданные дублируются на различные диски для передачи партнерам, к данным организован Интернет-доступ. До этого в штаб-квартире ВТО использовались ленточные накопители, но вскоре от них отказались, поскольку они не позволяют хранить данные так же долго и надежно, как оптические накопители, не обеспечивают прямой произвольный доступ, т. е. создать на их основе Интернет-решение невозможно. Кроме того, с ленты очень сложно дублировать данные.

Архив электронной почты

Одна из активно развивающихся сфер применения архивных накопителей — хранение архива электронной почты. В крупной фирме за годы работы корпоративная почтовая база, как правило, становится главным информационным ресурсом, при помощи которого можно поднять все контакты, проследить историю общения с клиентами и поставщиками, быстро найти важные документы и т. д.

В настоящее время существуют решения, объединяющие почтовый сервер компании и архивный накопитель. Специальное ПО позволяет проводить архивирование в режиме реального времени по правилам, которые назначаются системным администратором.

Актуальность проблемы

Актуальность проблемы архивного хранения растет столь же угрожающими темпами, как и объемы хранимых данных. А количество архивной информации в мировом масштабе увеличивается гораздо быстрее, чем количество всей прочей информации (рис. 4). Надо отметить, что в большинстве европейских стран и в США необходимость архивного хранения ключевой для отрасли информации закреплена на законодательном уровне. В мире существует порядка 25 000 директив и требований, в том числе постановления правительств и отдельных министерств Германии, Италии, США, Великобритании и т. д., которые требуют сохранения определенной информации, например, данных о финансовых транзакциях, биржевых сделках, медицинских исследованиях и страховых выплатах в течение 5-10 лет.

Fig.4 Рис. 4. Рост количества данных во всем мире (по данным Enterprise Storage Group).


Законодательные нормативы хранения данных в настоящее время активно разрабатываются и в России (при активном участии компании "Электронный Архив"). Планируемое вступление России в ВТО послужило мощным катализатором этого процесса. В ближайшее время многим компаниям, которые обязаны хранить свои данные в течение длительного срока, придется модернизировать системы хранения. Поэтому показатель прироста общемирового рынка архивных накопителей (15-20% в 2005 г., по прогнозам IDC) в России наверняка будет превышен.

Подводя итоги сказанному, можно утверждать, что универсальное и экономичное решение для большинства задач хранения данных в течение длительного срока — проверенные временем DVD-накопители. В том случае, когда требуется хранить сверхбольшие объемы данных, обеспечивать высокую скорость доступа к ним и возможность расширения системы в будущем, следует использовать архивные накопители на основе технологии UDO.

Вам также могут понравиться