Byte/RE ИТ-издание

Современные «умения» дисковых массивов

Сегодня на рынке присутствуют внешние дисковые массивы трех классов: старшего (high-end), среднего (midrange) и начального уровня (entry-level).

Массивы среднего и начального уровня построены по модульному принципу. Как правило, они состоят из смонтированных в 19-дюйм стойку одного или двух управляющих модулей (контроллеров массива), к которым подсоединяют дисковые полки, установленные в той же стойке. Модульность снижает расходы на первоначальную конфигурацию массива, экономит место в ЦОД, поскольку в той же стойке можно разместить другое оборудование (серверы, ленточную библиотеку, коммутаторы), и позволяет постепенно наращивать емкость массива путем установки в стойку дополнительных дисковых полок.

Массивы старшего класса – это в большинстве своем монолитные системы, т. е. даже в начальной конфигурации такой массив размещается в отдельном 19-дюйм шкафу, и хотя компоненты массива могут занимать лишь половину шкафа, в него нельзя установить дополнительное оборудование, например стоечные серверы и блейд-системы.

Массивы среднего класса отличаются от начального уровня ценой (ценовая граница между этими классами проходит на уровне 25 тыс. долл.), масштабируемостью и производительностью контроллеров массива. Если модели entry-level обычно поддерживают не более 120 жестких дисков и рассчитаны на обслуживание нескольких серверов стандартной архитектуры, то массивы midrange масштабируются свыше 500, а некоторые модели – до двух и даже трех 19-дюйм полок и до 1000 жестких дисков, и способны обеспечить централизованное хранение данных в достаточно крупном ЦОД, где работает более 10 серверов, в том числе и многопроцессорные Unix-серверы. В то же время, в отличие от массивов high-end, большинство устройств среднего класса не поддерживают серверы с «закрытой» архитектурой (мэйнфреймы, IBM AS/400, HP OpenVMS и HP NonStop).

Еще одно, и даже более важное, отличие массивов среднего класса от высшего – это число контроллеров. В классических массивах среднего класса поддерживается только два контроллера. Хотя уже появились массивы этого класса, которые масштабируются свыше двух контроллеров (например, HP 3Par T-Class поддерживает до 8 контроллеров), по этому показателю, от которого зависит общая производительность и отказоустойчивость дискового массива, они сильно отстают от систем high-end (в них устанавливается до нескольких десятков контроллеров).

Классическая функциональность midrange

Практически все системы среднего класса реализуют наиболее популярные варианты объединения дисков в RAID-массив, а именно RAID пятого и шестого уровней, обеспечивающие распараллеливание операций ввода-вывода в сочетании с защитой от потери данных из-за сбоя одного или двух дисков массива. В дисковых массивах компании NetApp на основе фирменной файловой системы реализованы RAID-4 и RAID DP, похожий на RAID-6.

Все массивы среднего класса поддерживают основные серверные ОС – Windows, Linux и коммерческие варианты Unix (прежде всего Solaris), поэтому их можно использовать для консолидированного хранения данных в ЦОД, где применяются серверы разной архитектуры (за исключением серверов на базе закрытых архитектур). Они также могут использоваться в качестве общей системы хранения серверных кластеров высокой доступности.

Практически стандартной для массивов этого класса стала функция мгновенных снимков (snapshots), с помощью которых удобно, не прерывая основные операции массива, проводить резервное копирование или делать копии больших объемов данных для углубленного анализа или тестирования новых версий приложений.

Для защиты данных от потери из-за крупных аварий в массивах среднего класса традиционно применяется удаленная репликация на такую же модель массива, установленную на отдельной площадке.

Новые задачи – новый функционал

Последние два-три года отмечены быстрым ростом продаж дисковых массивов среднего класса, который не смог остановить даже спад мировой экономики. Например, по оценкам Gartner, в середине 2010 г. продажи этих систем хранения выросли почти на 10% по сравнению с уровнем лета 2009 г.

Помимо непрерывного роста объемов данных корпоративных приложений, которые хранятся на дисковых массивах, увеличению спроса на системы среднего класса способствовало внедрение серверной виртуализации, для которой, как правило, требуется дисковый массив не только большой емкости, но и с высокой производительностью ввода-вывода, надежностью и гибкостью конфигурации. Второй новый фактор роста спроса на дисковые массивы среднего класса – это применение резервного копирования на жесткие диски вместо значительно более медленного традиционного резервного копирования на магнитные ленты.

Из технологических новинок последних лет прежде всего стоит отметить концепцию Unified Storage, впервые предложенную NetApp и затем взятую на вооружение другими вендорами. Если раньше все системы хранения четко делились по способу подключения к сети на системы для сетей хранения SAN, использующие блочный доступ к данным и интерфейс Fibre Channel, и NAS-системы, подключающиеся к локальной сети Ethernet и предназначенные для хранения файлов, то системы Unified Storage способны работать и в составе SAN, и как NAS-система. В результате на одной системе можно хранить как данные корпоративных приложений, которые используют блочный доступ, так и файлы пользователей.

Дополнительным стимулом для реализации Unified Storage становится внедрение 10-Гбит Ethernet с применением технологий Fibre Channel over Ethernet, что позволит применять сеть Ethernet и как традиционную LAN, и как сеть SAN, консолидируя с помощью 10 Gigabit Ethernet всю сетевую инфраструктуру предприятия.

Fibre Channel вытесняется новыми, более доступными по цене и стандартизованными технологиями не только на уровне сети, но и на уровне внутренней архитектуры массивов. Почти все представленные за последние полгода дисковые массивы среднего класса построены на базе технологии SAS, которая существенно упрощает проектирование новых систем по сравнению с Fibre Channel, позволяет применять стандартные компоненты и устанавливать в массивах более дешевые диски SATA большой емкости. Еще одно новшество дисковых массивов среднего класса – это поддержка 2,5-дюйм жестких дисков в дополнение к классическим 3,5-дюйм, которые увеличивают плотность размещения емкости и улучшают возможности распараллеливания ввода-вывода в дисковом массиве.

Твердотельные диски (SSD) практически стали стандартным компонентом современных дисковых массивов. Несмотря на значительно более высокие по сравнению с жесткими дисками цены эти накопители позволяют существенно улучшить «скорострельность» дискового массива и очень эффективны для хранения тех данных, к которым чаще всего осуществляются запросы, например, в транзакционных приложениях.

Комбинирование твердотельных дисков со скоростными жесткими дисками SAS и более медленными SATA-дисками большой емкости позволяет внутри одного массива организовать несколько уровней хранения данных с разными показателями скорости доступа и стоимости хранения 1 Гбайт. Для максимальной эффективности многоуровневого хранения требуются механизмы автоматического перемещения данных по определенным правилам между разными уровнями хранения, например, чтобы сам дисковый массив без участия системного администратора переводил данные, к которым стало меньше запросов или они устарели, с твердотельных дисков на более медленные жесткие диски SAS, а затем – и на SATA-диски. Такой механизм automatic tiering реализован, например, в EMC Clariion CX4/VNX, IBM Storwize V7000 (с помощью технологии Storage Easy Tier) и дисковых массивах компании Compellent, которую в конце прошлого года купила Dell.

Сокращение расходов на хранение 1 Гбайт данных обеспечивается в некоторых массивах за счет технологий дедубликации и онлайнового сжатия. Первоначально дедубликация использовалась для устранения повторного копирования идентичных наборов данных при резервном копировании на дисковые библиотеки, но затем она была расширена и на хранение других типов данных, прежде всего на образы виртуальных машин VMware, в которых многие данные повторяются.

Функция thin provisioning помогает сократить первоначальные расходы на закупку систем хранения. Дело в том, что при традиционном подходе дисковые массивы закупаются с большим запасом по емкости в расчете на рост объемов данных в будущем. Для покупателей было бы выгодней покупать массив в той конфигурации, которая соответствует текущим объемам данных, и потом постепенно докупать и устанавливать дополнительные диски, однако тогда при каждом расширении емкости массива придется останавливать приложения, чьи данные хранятся на массиве, и заново выделять им емкость. Такие операции, если они выполняются достаточно часто, создают существенную нагрузку на системного администратора и негативно влияют на степени доступности важных для бизнеса приложений.

Функцию thin provisioning впервые реализовала компания 3Par, в прошлом году купленная HP, еще в 2003 г., а к концу прошлого десятилетия она стала стандартным функционалом массивов среднего и старшего класса. При использовании thin provisioning емкость выделяется приложениям не напрямую (т. е. на уровне отдельных дисков), а из виртуального пула, в который объединены все диски массива. Виртуальную емкость из этого пула можно выделить с расчетом на рост данных в будущем, причем физическая емкость может быть намного меньше емкости выделенному приложению виртуального тома.

Дополнительной к thin provisioning является функция thin reclamation, т. е. возврата в виртуальный пул той части емкости виртуального тома, которая оказалась ненужной приложению (например, из-за завышенного прогноза роста данных или при удалении больших объемов данных приложения). Для thin reclamation, которая также впервые была реализована в массивах 3Par, требуется, чтобы система хранения узнала, что приложению не нужна какая-то емкость. Этот механизм взаимодействия с использующим thin provisioning дисковым массивом уже реализован в файловой системе Symantec VxFS и СУБД Oracle.

Для сокращения энергопотребления и тепловыделения дисковых массивов ряд вендоров реализовали в своих системах функцию spin-down, временно останавливающую те диски, к которым в последнее время не было обращений. Прежде всего эта функция применяется к SATA-дискам, на которых обычно хранятся редко запрашиваемые данные.

Среди новых функций, обеспечивающих дополнительную защиту от аппаратных сбоев, стоит отметить применяемую некоторыми вендорами (например, HDS) архитектуру контроллеров active-active с балансировкой нагрузки между двумя контроллерами массива, и реализованную (например, в массивах 3Par) функцию удаленной репликации между тремя площадками для обеспечения поддержания доступа к данным в случае катастроф. Иногда применяется многоузловая конфигурация контроллеров, что позволяет минимизировать падение производительности при выходе из строя одного из контроллеров.

При разработке новых дисковых массивов большинство вендоров ориентируются сегодня на применение компонентов, выпускаемых для серверов стандартной архитектуры, например процессоров Intel Xeon. Эта стандартизация позволяет избавиться от больших затрат, связанных с разработкой и производством специализированных ASIC, и сосредоточиться на программно-реализуемом функционале, который в будущем можно будет перенести на новые процессоры Intel. Например, уже упоминавшийся HP P4000 в качестве аппаратной платформы контроллера массива использует серверы стандартной архитектуры HP ProLiant, к которым подключаются внешние дисковые полки, IBM Storwize V7000 – аналогичные серверы IBM System X, а в только что представленном EMC VNX установлена только одна микросхема ASIC. В продуктах 3Par с помощью ASIC на аппаратном уровне реализован механизм thin provisioning.

Подробнее см. статью «Дисковые массивы стали умнее», «Бестселлеры IT-рынка», №1, март 2011 г.

Ресурс BYTEmag.ru имеет эксклюзивное право на перепечатку данного материала. Републикация на других Интернет-ресурсах не разрешается.

Системы хранения IntellectDigital на основе ПО Avrora

Полина Трофимова, компания AvroRAID, Игорь Долманов, компания «СВЕТ Компьютерс»

Системы хранения данных IntellectDigital семейства AVS производства компании «СВЕТ Компьютерс» представляют собой аппаратно-программный RAID, использующий уникальный многопоточный алгоритм расчета RAID6 и оптимизированный для достижения максимально высокой производительности при работе с потоковыми данными.

Читать далее

Экономичные сетевые решения для хранения данных

Артем Берман, генеральный директор StarWind Software

Спрос на сетевые решения для хранения данных непрерывно растет, но до сравнительно недавнего времени позволить себе корпоративную сеть хранения могли лишь крупные организации, обладающие достаточно большим бюджетом на развитие вычислительной инфраструктуры. Тем не менее потребность в SAN велика и у малого/среднего бизнеса. К счастью, существуют технологии, позволяющие организовать полнофункциональную сеть хранения данных с минимальными затратами.

Читать далее

Вам также могут понравиться