Храним данные. Как правильно?
В наш цифровой век большинство уже столкнулось с тем, что не только у предприятий, но и у обычных людей есть информация, которую они считают «жизненно важной». И очень часто такая информация уникальна, т.е. существует в единственном экземпляре. Зачастую стоимость потерянных данных в разы превышает стоимость вышедшего из стоя носителя информации. Поэтому перед человеком или предприятием стоит дилемма: стоимость или надежность хранения. Большинство людей, пытавшихся сохранить цифровую информацию, сталкивались с такой закономерностью, что надежность хранения прямо пропорциональна цене. Если в эту оценку мы включим еще и защиту информации от криминальных действий, то цена решения для хранения данных будет еще больше.
Осознав подобную зависимость, давайте определимся, насколько ценна та информация, которую мы хотим сохранить. Если это фильм, скачанный из Интернета, то его ценность практически равна нулю: эта информация растиражирована очень сильно, и его всегда можно скачать снова, в Интернете доступны тысячи копий. Если же это фильм, смонтированный по мотивам любимого отпуска, то сам он и его исходники бесценны. Для предприятий ситуация в принципе та же самая: одна информация имеет минимальную важность, потеря другой приведет к финансовым потерям или даже к краху бизнеса.
Итак, мы выяснили, что для нас важно, а что просто информационный мусор. Теперь нужно решить, как мы будем эту информацию хранить.
Облачные услуги
До недавнего времени выбор был не так уж и велик – мы хранили информацию локально и сами отвечали за нее. Теперь же появилась возможность использования технологии STaaS (Storage as a Service), т.е. хранение как услуга или, как сейчас это модно называть, «хранение информации в облаке».
Наиболее доступные из условно бесплатных систем – это Яндекс Диск, Google Disk, Microsoft SkyDrive, Dropbox и другие сервисы. Большинству пользователей они известны как бесплатная услуга для частных лиц. Но мало кто знает, что многие облачные провайдеры предоставляют услуги и для корпоративных клиентов. При заключении контракта вы оплачиваете объем хранения и договариваетесь об уровне доступности информации (SLA). У данного подхода, как ни странно, всего два недостатка. Первый и основной – это доверие: насколько мы готовы доверить оператору облачных услуг личную или жизненно важную информацию для нас или нашего бизнеса. Второй – это связь, которая должна быть быстрой, устойчивой и круглосуточной, что на просторах нашей родины не всегда возможно. С другой стороны, оператор облачных услуг может себе позволить нанимать высококвалифицированные кадры и обеспечивать уровень надежности хранения данных все же более высокий, чем в большинстве компаний с их бюджетом.
Классические системы хранения – и ZFS
Рассмотрев возможности хранения данных в облаке, обратимся теперь к классическим методам сохранения информации, а именно к старому доброму диску или набору дисков. Обычно для описания такого хранилища используется термин «система хранения».
Рынок систем хранения сегодня достаточно разнообразен. Это хранилища данных от монстров ИТ-индустрии – IBM, HP, NetApp, HDS, EMC, а также от менее известных производителей. Выбор того, на чем мы будем хранить необходимую информацию, лежит между бюджетом и надежностью. Иначе говоря. бесконечную надежность можно обеспечить только с помощью бесконечного бюджета. Впрочем, не все так плохо. Сегодня высокую степень надежности можно получить не только задорого, но и вполне дешево. Эта возможность появилась не так давно благодаря компании Sun Microsystems (ныне входящей в состав Oracle), которая создала замечательную ОС Sun Solaris 10, включив в ее состав файловую систему ZFS, а саму ОС сделав свободной для использования (не требует лицензирования).
Уникальность ZFS заключается в том, что данная файловая система входит в состав универсальной ОС, позволяет создавать наборы дисков практически независимо от аппаратной начинки сервера. Например, у нас есть 10 SATA дисков, подключенных через встроенный не RAID-контроллер системной платы и еще пару других контроллеров разных производителей. Из них мы без проблем собираем RAID pool на уровне ОС, т.е. набор метаданных контролирует сама ОС Sun Solaris, и при выходе любого контроллера или сервера из строя мы можем перенести наши жесткие диски на аналогичный сервер, поддерживающий ZFS, получив рабочий набор данных. При этом в ZFS есть все «фишки» старших сестер. Например, Oracle выпускает системы хранения корпоративного класса на основе ZFS. ZFS может хранить до 2128 байт информации, умеет дедуплицировать и компрессировать данные, делать снимки и репликацию, создает RAID, аналогичные 1, 10, 5, 6, 50, 60, поддерживает флэш-акселерацию чтения и записи, обладает уникальным алгоритмом контроля целостности данных.
Но главное достоинство ZFS – то, что это свободная система. Именно это позволило проекту FreeBSD интегрировать ее в свою ОС – а из него уже вырос проект FreeNAS, позволяющий любому желающему недорого создать систему хранения с надежностью корпоративного класса.
С одной стороны, соблазнительно при малых капитальных затратах получить надежное хранилище данных, но, с другой стороны, любая уникальная система требует уникального сопровождения. Так, у вас должны быть инженеры, способные поддерживать «на плаву» такую систему хранения. К тому же обслуживание уникальных систем обходится намного дороже. Именно поэтому в больших ИТ-средах требуется унифицированный подход к хранению данных с использованием наработок известных производителей, имеющих в штате лучших специалистов и предлагающих системы хранения, установленные по всему миру в сотнях тысячах экземпляров с уже выявленными недочетами в работоспособности.
* * *
И в заключение – старый как информационный мир совет: «Делайте бэкап!» Ведь согласно теории надежности оптимальным с точки зрения критерия цена/надежность является тройное резервирование информации.