Как работает технология RAID и что ее ждет в будущем
RAID-массивы жестких дисков в течение двух десятилетий были основным вариантом хранения критичных данных. Однако с появлением твердотельных накопителей SSD и массовым внедрением систем хранения на их основе ситуация резко изменилась. Сохраняется ли потребность в этой технологии в индустрии хранения данных?
Распространенная в индустрии хранения данных аббревиатура RAID расшифровывается как Redundant Array of Independent Disks – резервированный массив независимых дисков. RAID-массив – это система, в которой для хранения данных используется несколько жестких дисков.
Для использования RAID в дисковом массиве или сервере либо устанавливается специальная карта с контроллером RAID, либо механизм RAID реализуется с помощью специального программного обеспечения, запускаемого на сервере. Хотя софтверный вариант RAID обычно дешевле, он работает медленнее, чем аппаратный контроллер RAID, и создает дополнительную нагрузку на центральный процессор сервера. Из-за этого производительность основных бизнес-приложений, которые обслуживает сервер, может снижаться.
Существует несколько вариантов (уровней, level) RAID, каждый из которых обеспечивает свои преимущества в виде улучшения скорости доступа к хранимым данным и/или защиты их от сбоев.
Основные варианты RAID
Чаще всего используются следующие четыре варианта:
RAID 0, или страйпинг. Обеспечивает ускоренный доступ к данным за счет разбиения их на небольшие блоки, которые распределяются по всем дискам массива. При этом за счет распараллеливания операций ввода-вывода при увеличении числа дисков в массиве ускоряется и скорость доступа к ним. Однако этот вариант RAID не предусматривает резервирования, поэтому если даже один диск массива сломается, то будут потеряны все данные, которые хранились на этом массиве.
RAID 1, или зеркалирование. Обеспечивает максимальную защиту от отказов, создавая для каждого диска массива, на котором хранится оригинал данных, его точную (зеркальную) копию на другом диске массива. Минусом RAID 1 является увеличение в два раза стоимости хранения, поскольку все данные хранятся в двух экземплярах. Кроме того, RAID 1 не дает никакого выигрыша в производительности доступа к данным.
RAID 5. Сочетает улучшение как скорости доступа к данным, так и их защиты от аппаратных сбоев. Для использования этого варианта RAID в массиве должно быть не менее трех дисков. Как и в RAID 0, в пятом RAID данные распределяются по нескольким дискам, однако для защиты данных используется контрольная сумма блоков данных, которая записывается на отдельном диске массива. При выходе из строя одного диска данные, которые были на нем записаны, можно восстановить по контрольным суммам. Таким образом, RAID 5 обеспечивает баланс между производительностью и отказоустойчивостью дискового массива, правда, хранение контрольных сумм уменьшает полезную емкость массива. Вариантом RAID 5, хотя и используемым намного реже, является RAID 6, предусматривающий защиту данных с помощью двойной четности, т.е двух дисков для контрольных сумм, и позволяющий восстановить данные, даже если в массиве из строя вышли сразу два диска.
RAID 10. Это комбинация RAID 1 и RAID 0, реализующая как зеркалирование данных, так и их страйпинг, что обеспечивает высокую производительность и защиту от сбоев дисков. Для построения массива RAID 10 требуется минимум четыре диска.
Уходит ли эпоха RAID-массивов?
Основы технологии RAID были разработаны в 1980-х, и в последующие два десятилетия RAID-массивы стали основным вариантом хранения критичных для бизнеса данных. Однако с появлением твердотельных накопителей (Solid State Disk, SSD) и массовым внедрением систем хранения на их основе ситуация резко изменилась. Некоторые производители твердотельных накопителей и систем хранения на их основе утверждают, что технология RAID, изначально разработанная для жестких дисков, больше не нужна: тот уровень производительности, который раньше обеспечивался использованием RAID-массива (например, RAID уровней 0 и 5), теперь достигается с помощью всего лишь одного твердотельного диска. А поскольку в твердотельных дисках в отличие от винчестеров нет движущихся компонентов, то риск поломки у них намного меньше и нет необходимости использовать те алгоритмы RAID, которые защищают данные от сбоев накопителя.
Тем не менее RAID еще рано списывать со счетов. Во-первых, жесткие диски по-прежнему широко используются в индустрии хранения, потому что стоимость емкости в расчете на 1 Гбайт у них все еще значительно ниже, чем у SSD. Правда, сейчас в основном на них хранятся так называемые холодные данные, которые редко запрашиваются (в отличие от горячих, обычно хранящихся на SSD), но тем не менее для этих холодных данных тоже нужно обеспечить быстрый доступ и надежное хранение, и это очень удобно сделать с помощью RAID.
Во-вторых, RAID можно применять и к массивам твердотельных дисков, чтобы дополнительно улучшить производительность доступа к данным и защиту от отказов отдельных накопителей, связанных с износом ячеек памяти, а также для равномерного распределения нагрузки между этими накопителями, что уменьшает износ ячеек.
Правда, учитывая разные принципы работы жестких дисков и SSD, для использования RAID с твердотельными накопителями потребуются новые варианты RAID, учитывающие специфику ввода-вывода дисков SSD. Пока на рынке есть твердотельные RAID-массивы только начального уровня, представляющие собой NAS-системы с несколькими накопителями и рассчитанные на обслуживание продвинутых пользователей либо небольшой студии.