Технологические тенденции в области СХД
BYTEmag.ru
Как известно, типичный жизненный цикл систем хранения составляет три года (при этом сама система хранения может эксплуатироваться и пять, и семь лет, однако сами производители СХД стремятся соблюдать трехлетний цикл обновления своей продукции, и выпущенные более трех лет назад системы обычно считаются устаревшими). Поэтому при анализе основных тенденций рынка систем хранения мы будем ориентироваться на те тенденции, которые наиболее явно прослеживаются за последние три года.
Виртуализация
Виртуализация примерно с 2001 г. остается одной из самых горячих тем рынка СХД, однако за прошедшее время акценты при ее рассмотрении применительно к СХД существенно изменились. В начале нынешнего десятилетия большие надежды возлагались на виртуализацию как средство построения общего пула ресурсов хранения в масштабе всей сети хранения SAN, включая и дисковые массивы разных производителей. Реализация этого варианта технологии обещала существенно упростить обслуживание SAN и повысить эффективность использования дисковой емкости. К сожалению, внедрение виртуализации в масштабе SAN оказалось слишком сложной задачей даже для ведущих вендоров, и доступные сегодня немногочисленные виртуализаторы SAN используются только как нишевые решения, предназначенные для ограниченного круга задач, например, для организации удаленной репликации данных между двумя массивами.
Виртуализация на уровне одной системы хранения оказалась более успешной технологией — она стала фактическим стандартом для систем среднего и старшего класса и постоянно совершенствуется. Например, на основе объединения всех дисков массива в виртуальный том за последние три года в большинстве дисковых массивов реализована функция thin provisioning, т.е. возможность выделить приложению на логическом уровне емкость, объем которой существенно превышает физическую емкость выделенных тому же приложению жестких дисков, и по мере заполнения этих дисков прозрачно для приложения добавлять ему новые диски. Применение thin provisioning позволяет обойтись без покупки дисковой емкости впрок, т.е. покупатель может заказать массив в той конфигурации емкости, которая требуется приложению сегодня, а не в той, которая будет востребована через год или через два.
Однако когда сегодня речь заходит о виртуализации, то чаще всего речь идет не о СХД, а о серверной виртуализации на основе решений VMware, Microsoft Hyper-V или Citrix Xen. Тем не менее массовое внедрение серверной виртуализации стало существенным стимулом для развития рынка СХД. Дело в том, что при развертывании даже на одном физическом сервере нескольких виртуальных машин резко возрастают требования к дисковой системе. Прежде всего требуется дополнительная емкость для хранения образов виртуальных машин. Во-вторых, существенно увеличиваются требования к производительности дисковой системы, поскольку она должна обеспечивать пропускную способность для ввода-вывода нескольких виртуальных машин, а ее выход из строя или сбой приведет к нарушению работы всех виртуальных машин и приложений, которые на них выполняются. В результате если раньше с серверами стандартной архитектуры в основном приобретались СХД начального уровня, то сейчас для внедрения виртуализации на платформе x86 все чаще закупаются более дорогие системы среднего класса, например EMC Clariion CX4 и HP StorageWorks EVA.
Меняется и структура затрат на оборудование в современном ЦОД — благодаря виртуализации удается сократить число необходимых физических серверов за счет консолидации на одной машине нескольких приложений, но в то же время увеличиваются затраты на покупку более мощных дисковых массивов.
Повышение эффективности хранения
Применение серверной виртуализации ставит новые задачи и перед резервным копированием данных, поскольку образы виртуальных машин могут занимать много места и содержат много повторяющихся блоков данных. Эта проблема дала новый импульс применению технологии дедупликации, т.е. устранения повторного резервного копирования одних и тех же данных. Сама эта технология стала активно применяться с середины нынешнего десятилетия по мере замены магнитной ленты на дисковые библиотеки резервного копирования, поскольку стоимость хранения 1 Гбайт данных даже на относительно дешевых SATA-дисках существенно выше, чем на ленте, поэтому важно максимально снизить емкость, необходимую для хранения резервных копий.
Активно развивается в СХД и применение моментальных снимков данных (snapshots) и thin replication. Snapshots – универсальное обозначение техники ускоренного (условно – моментального) создания резервной копии, что позволяет предотвратить искажение данных в момент снятия копии, исключив возможность одновременного обращения внешнего приложения и функции backup к одному и тому же блоку данных. Но главное: с применением snapshot можно организовать резервное хранение только изменяемых данных, копируемых непосредственно перед перезаписью, а не всего целокупного объема информации, что на порядки снижает отводимую под резервное копирование емкость. Thin replication (передача действительных изменений) похожим образом позволяет переносить при репликации данных только измененные блоки, делая этот процесс значительно более эффективным.
Унификация протоколов
Еще одна технологическая тенденция, которая вышла на первый план в индустрии СХД в последние годы, — это переход к архитектуре Unified Storage, т.е. к универсальным системам хранения. Если раньше все дисковые массивы четко делились на системы для SAN, которые подключаются к сети хранения по Fibre Channel и используют блочный доступ к данным (такая организация хранения оптимальна для баз данных), и системы NAS, которые хранят данные в виде файлов и подключаются к IP-сети по Ethernet, то теперь ведущие вендоры СХД (например, EMC и NetApp) позиционируют свои продукты как системы, которые можно использовать и для блочного, и для файлового доступа и подключать и к сетям SAN, и к IP-сети.
Новые перспективы для Unified Storage открывает внедрение 10-Гбит Ethernet и технологии Fibre Channel over Ethernet (FCoE), позволяющей по одной сети Ethernet передавать как IP-трафик, так и трафик блочного доступа данных, для которого обычно требуется отдельная сеть SAN. В результате упрощается сетевая инфраструктура ЦОДа, а универсальная СХД теперь может с помощью только одной сетевой карты передавать оба типа трафика.
Переход на 10-Гбит Ethernet будет способствовать и внедрению систем хранения на базе технологии iSCSI, предназначенных для построения SAN на базе обычной Ethernet-сети. При использовании 1-Гбит Ethernet скорость передачи данных с помощью iSCSI оказывалась существенно ниже, чем у Fibre Channel, поэтому SAN на базе iSCSI работала существенно медленнее традиционной SAN на базе Fibre Channel и могла стать узким местом при передаче данных между СХД и сервером. Как надеются производители СХД на базе iSCSI, переход на скорости 10 Гбит/с станет стимулом для массового внедрения этой технологии.
Solid State Drives
Другая важная тенденция современных дисковых массивов — это применение твердотельных дисков (Solid State Disk, SSD), которые работают намного быстрее даже самых скоростных жестких дисков. Хотя в расчете на 1 Гбайт они все еще намного дороже, чем жесткие диски, с точки зрения быстродействия ввода-вывода системы хранения один диск SSD может заменить целую полку жестких дисков, что дает экономию не только на стоимости «железа», но и на существенно сократившемся энергопотреблении СХД, обслуживающей приложения с интенсивными операциями чтения/записи, и месте, которое она займет в ЦОДе. Применение SSD позволяет по-новому реализовать схему многоуровневого хранения — твердотельные диски образуют нулевой уровень, куда записываются данные, которые чаще всего запрашиваются. Данные, которые запрашиваются реже, сохраняются на дисках SAS (второй уровень), а для хранения архивных данных используются диски SATA большой емкости.
С другой стороны, ускорение доступа к часто используемым данным реализуется и на уровне отдельной системы хранения – речь идет о развитии технологий кэширования. Основным направлением здесь становится использование дополнительных флэш-емкостей, выполняющих роль быстрой кэш-памяти для массива жестких дисков. В ряде случаев использование такой конфигурации – жесткие диски плюс флэш-кэш – может оказаться сравнимым по производительности и даже более быстрым, чем массив с SSD. При этом первый вариант на сегодня более дешев. Так что в какой-то мере технология кэширования жестких дисков составляет конкуренцию применению SSD.
Форм-фактор 2,5 дюйма
Другая новая тенденция в архитектуре дисковых массивов, которая просматривается по сделанным осенью прошлого года анонсам СХД, – это применение 2,5-дюйм дисков вместо 3,5-дюйм. На уменьшенный форм-фактор дисков в качестве основного уже давно перешли производители серверов стандартной архитектуры, и он часто применялся в СХД начального уровня, однако только в 2010 г. на рынке появились дисковые массивы среднего и старшего класса, в которых поддерживаются 2,5-дюйм накопители. Миниатюризация жестких дисков, как заявляют их производители, позволит увеличить плотность размещения емкости и энергопотребление дисковых массивов.
Коммодитизация компонентной базы
Коммодитизация (т.е. использование в системе стандартных электронных компонентов, изготовляемых большими партиями и потому существенно более дешевых, чем заказные микросхемы) кардинально изменила рынок серверов, где доля серверов стандартной архитектуры постоянно увеличивается, и сейчас начинает проникать на рынок СХД. Контроллеры многих дисковых массивов среднего и старшего класса (например, EMC Symmetrix V-Max, HP StorageWorks LeftHand и NetApp FAS и Sun Open Storage 7000) представляют собой обычные серверы стандартной архитектуры на базе процессоров x86, на которых работает управляющее ПО массива. Применение стандартных компонентов не только удешевляет разработку массива, но и позволяет быстрее реализовать новые функции СХД на уровне ПО — теперь архитектуры СХД не привязаны к циклу разработки дорогостоящих заказных микросхем.
В плане использования HDD также происходит похожий по сути процесс. Вендоры постепенно переводят свои дисковые массивы с дисков Fibre Channel на Serial Attached SCSI (SAS), поскольку эта технология упрощает архитектуру массива и позволяет применять в нем более дешевые стандартизованные компоненты, тем более что производители жестких дисков прекратили разработку новых моделей с интерфейсом Fibre Channel, сделав ставку на SAS.
Тем не менее коммодитизация компонентов СХД еще не означает полной коммодитизации этого рынка. Наоборот, на первый план выходит способ, которым тот или иной вендор может реализовать на стандартном железе новые технологии раньше своих конкурентов. О стремлении ведущих вендоров получить преимущество за счет уникальных технологий, отсутствующих у конкурентов, свидетельствует волна поглощений специализированных игроков рынка СХД с перспективными разработками в области виртуализации, дедупликации, iSCSI и NAS. Даже такие гиганты с мощным отделением R&D, как EMC, HP и IBM, заплатили миллиарды долларов за небольшие компании и включили разработанные ими СХД в свой продуктовый портфель.
Вернуться на главную страницу обзора «Системы хранения данных для бизнеса»