Высокопроизводительная NAS-платформа
В конце прошлого года Hitachi Data Systems (http://www.hds.com), дочерняя компания корпорации Hitachi, объявила о важных шагах, которые, как ожидается, позволят ей быстро расширить свое присутствие на глобальном рынке систем хранения для высокопроизводительных вычислений. В настоящее время на рынке NAS (Network Attached Storage) доминируют компании Network Appliance и EMC — по данным IDC, им принадлежит 70% этого сегмента. Предпринятые Hitachi шаги, подкрепленные инвестициями в корпорацию BlueArc (http://www.bluearc.com), инновационного лидера в области сетевого хранения, включают пятилетнее OEM-соглашение с BlueArc, вступающее в действие по всему миру, и доступность с момента объявления платформы Hitachi High-performance NAS Platform, которая снимает ограничения, присущие предлагаемым сегодня на рынке сетевым системам хранения файлов.
Напомним, что два года назад Hitachi стремительно вышла на рынок NAS, представив встроенные системы NAS Blade следующего поколения для TagmaStore Universal Storage Platform. С выпуском систем NAS Blade корпорация сосредоточилась на поиске потенциальных заказчиков NAS-файлеров и шлюзов, а также на консолидации всех существующих шлюзов и файлеров NAS, присутствующих в корпоративной среде. Всего одна система NAS Blade позволяла объединить множество файлеров и устройств NAS большой общей емкости, уменьшив при этом стоимость и трудоемкость процесса управления десятками островов, состоящих из файл-серверов или NAS-файлеров.
Согласно прогнозу IDC, среднегодовые темпы роста рынка NAS составляют 14,7%, так что к 2008 г. его объем достигнет 3089 млрд долл. Соотношение цена/производительность новых систем NAS Blade дало компании возможность агрессивно отвоевывать долю рынка у традиционных поставщиков систем NAS. Стратегия Hitachi заключалась в том, чтобы вслед за выпуском встроенных систем NAS Blade в составе своих высокопроизводительных продуктов представить серию профильных решений NAS среднего уровня, нацеленных на быстрорастущие рынки предприятий категории SMB с ИТ-системами на платформах Windows и Linux. Эта стратегия предполагала, что все решения должны быть построены на самых передовых технологиях NAS и предлагаться по привлекательным ценам с множеством вариантов конфигурации.
Конвергенция SAN и NAS
Для повышения эффективности и уменьшения стоимости хранения данных производители, специализирующиеся на системах хранения данных, начали объединять лучшие элементы устройств NAS и SAN (Storage Area Network). Напомним, что типичная реализация SAN включает ряд дисковых массивов, подключенных к коммутатору, который, в свою очередь, соединен с рядом серверов. Традиционно системы SAN применялись с такими программами, как СУБД, которые обращаются к данным на уровне блоков. Аппаратура NAS, напротив, позволяет извлекать данные на уровне файлов — это более высокоуровневый способ организации информации. Не секрет, что в среде транзакционных баз данных доступ на уровне блоков выполняется быстрее, так как для поиска нужных битов требуется меньше шагов. Другой фактор, определяющий повышенное быстродействие SAN, связан с применением интерфейса Fibre Channel — технологии, которая позволяет передавать данные со скоростью до нескольких гигабит в секунду. Более того, емкость SAN относительно легко увеличить, добавляя к сети новые дисковые массивы. К недостаткам же SAN следует отнести дорогостоящее оборудование и трудность организации совместной работы с файлами.
Системы NAS, в свою очередь, представляют собой по сути выделенные компьютеры, обслуживающие файлы по сети. Оборудование NAS применяется для хранения файлов, созданных в таких приложениях, как системы автоматизированного проектирования или электронные таблицы. Доступ на уровне файлов дает возможность сразу нескольким пользователям работать с файлами без копирования данных. Например, несколько конструкторов могут одновременно работать над одной и той же моделью автомобиля. К тому же устройства NAS проще в установке и не нуждаются в коммутаторах или сетевых адаптерах. Но они, как правило, медленнее, чем системы SAN.
Одним из способов комбинировать достоинства систем NAS и SAN стали шлюзы NAS, которые раньше еще называли «надстройками» (NAS heads). Эти продукты расширяют возможности наращивания емкости по сравнению с традиционным изолированным хранилищем NAS; иными словами, эти бездисковые устройства позволяют подключать системы SAN к сетям Ethernet. Одним из признаков сближения NAS и SAN стала растущая популярность таких NAS-шлюзов. По прогнозам аналитической фирмы Gartner, в 2007 г. объем рынка шлюзов превысит 215 млн долл. Для сравнения: доходы от оборудования NAS со встроенной дисковой памятью, по прогнозу той же Gartner, в этом году достигнут 2,8 млрд долл., а доходы от оборудования SAN — 10,3 млрд долл.
Объединение SAN и NAS стало составляющей более долгосрочной тенденции, связанной с повышением эффективности использования ресурсов дисковой памяти, аналогично виртуализации серверов. Десять лет назад большая часть данных, с которыми работали серверы, содержалась в хранилищах, подсоединенных непосредственно к этим серверам. Но такие изолированные «острова» памяти были задействованы слабо — всего на 15—30%. В большинстве центров обработки данных, в том числе и в тех, которые используются компаниями малого и среднего бизнеса, сегодня активно идет процесс слияния SAN с напрямую подключаемыми к сети через специальные шлюзы системами хранения NAS. Для этого заказчики могут использовать дисковый массив, поддерживающий разные протоколы — FC, IP и iSCSI. Хотя эти технологии часто рассматривают как взаимоисключающие, они постепенно начинают применяться вместе. Как полагают некоторые эксперты, эта тенденция сохранится по крайней мере в течение следующих десяти лет.
Многопротокольная система хранения
В прошлом году Hitachi пополнила линейку устройств хранения среднего класса Workgroup Modular Storage (WMS) и Adaptable Modular Storage (AMS) файловыми системами NAS. Так, модель Hitachi TagmaStore AMS1000 превосходит по своим характеристикам традиционные показатели, присущие системам хранения среднего класса. Она реализует такие мощные критически важные функции хранения, как создание в кэш-памяти 32 логических разделов, перемещение данных между разными уровнями хранения без прерывания работы приложений и — впервые в индустрии — поддержку одновременно нескольких протоколов (iSCSI, NAS и Fibre Channel) без помощи внешних серверов или адаптеров. AMS1000 стала единственной из систем хранения среднего класса, предоставляющей технологию многоуровневого хранения, что позволяет предприятиям оптимизировать инфраструктуру хранения для работы корпоративных приложений так, чтобы расходы, производительность, надежность и доступность соответствовали требованиям конкретного приложения.
Устройство AMS1000 хорошо подходит в качестве отдельно стоящей системы хранения и обеспечивает заказчикам высокую гибкость при создании нескольких уровней хранения в рамках одной стойки (в том числе за счет жестких дисков с интерфейсом SATA емкостью 250, 400 и 500 Гбайт): высокоскоростные диски Fibre Channel применяются для обслуживания онлайновых приложений, которым требуется минимальное время отклика, а затем без нарушения работы приложений данные перемещаются на экономичные SATA-диски для архивирования. AMS1000 также можно использовать в качестве внешней многоуровневой или архивной системы хранения в виртуализованной среде под управлением универсальной платформы Hitachi TagmaStore Universal Storage Platform либо контроллера Network Storage Controller и ПО Hitachi Universal Volume Manager.
Напомним, что TagmaStore AMS1000 пришла на смену популярной мощной системе среднего класса Thunder 9585V, при этом обеспечивая пропускную способность кэш-памяти 13 Гбайт/с, полную поддержку интерфейса Fibre Channel 4 Гбит/с, поддержку до 4096 логических разделов (LUN) и 16 Гбайт кэш-памяти, что соответственно на 70, 100, 100 и 100% лучше аналогичных показателей ее предшественницы. В системе реализован интегрированный набор целого ряда функций корпоративного уровня, которые ранее не были доступны в системах среднего класса, а именно: деление кэш-памяти на логические разделы, использование виртуальных портов хранения и защищенных доменов Host Storage Domain. Подобные функции помогают ИТ-подразделениям оптимизировать производительность и обеспечить в гетерогенной среде безопасный доступ к данным для критически важных корпоративных приложений, таких, как электронная почта, ERP, CRM и базы данных. С помощью диспетчера разделов кэш-памяти (Cache Partition Manager) система AMS1000 интеллектуально настраивается в соответствии с уровнем производительности, который требуется для высокопроизводительных вычислений, работы мультимедийных приложений, приложений для моделирования столкновений автомобилей и обработки сейсмических данных, онлайновой обработки транзакций (OLTP). При этом система способна одновременно обслуживать в разных разделах до 32 приложений, данные которых будут полностью изолированы друг от друга, тем самым оптимизируя производительность кэш-памяти для каждого приложения.
Технология SiliconServer
За последние несколько лет корпорация BlueArc стала лидером по инновациям в области сетевого хранения данных. Семейство систем хранения BlueArc Titan обеспечивает высокую производительность, масштабируемость и простоту использования. Его патентованная архитектура позволяет решать бизнес-задачи, слишком трудные для альтернативных систем.
[Фото]Модули Titan.
Первый продукт корпорации, SiliconServer Storage, представлял собой подключаемую к сети напрямую систему хранения NAS, основанную на новой архитектуре, в которой перемещения данных и манипуляции с ними выполнялись на аппаратном уровне. Предложенная архитектура обеспечивала высокую скорость передачи по кабелю между локальной сетью и высокопроизводительными дисковыми RAID-массивами с интерфейсом Fibre Channel. Кроме того, эта архитектура реализовала масштабируемую и эффективную по стоимости высокопроизводительную платформу хранения и для серверов (Unix, Windows), и для Интернет-клиентов. Первой практической реализацией SiliconServer стал накопитель Si7500.
Заметим, что устройства с такой архитектурой реализуют функции файл-сервера на аппаратном уровне, снимая, таким образом, фундаментальные ограничения традиционных серверных решений. Технология SiliconServer использует большое число конечных автоматов для обеспечения той же самой функциональности, которую ОС реализует в обычном файл-сервере, но при более высокой производительности и надежности. Хотя архитектура SiliconServer сильно отличается от обычных серверов, она использует стандартные протоколы для связи с существующими клиентскими компьютерами.
Для создания масштабируемой платформы сервер построен из нескольких отдельных секций или подсистем. Одна из таких подсистем представляет собой сервер, реализующий функциональность протокола TCP/IP. Другая подсистема обеспечивает поддержку различных файловых систем, включая NFS, CIFS, HTTP, FTP и NDMP, третья реализует саму файловую систему и последняя — кэширование и управление для подключенных систем хранения. Каждая из подсистем подключена к соседним через две высокоскоростные шины, работающие только в одном направлении. Комбинация этих шин образует два отдельных канала передачи данных, не создающих взаимных задержек, благодаря чему SiliconServer может пользоваться всеми преимуществами дуплексного режима тех сетей, к которому он подключен. Данные могут одновременно приниматься и посылаться с высокой скоростью, что обеспечивает максимальную скорость передачи (полный дуплекс). Дополнительные шины обеспечивают передачу данных между элементами аппаратной обработки в той же подсистеме, поэтому, например, соединение TCP/IP может быть организовано локально, никак не влияя на другие подсистемы SiliconServer.
В архитектуре SiliconServer обработку данных выполняют аппаратные конечные автоматы, что помогает реализовать различные протоколы, необходимые для обслуживания файлов. Каждый из этих элементов представляет собой набор из двух микросхем программируемых логических матриц FPGA (Field Programmable Gate Arrays). Во время загрузки системы микросхемы программируются с помощью файла списка соединений, где указано, как должны быть соединены транзисторы микросхемы, и создаются конечные автоматы, позволяющие им выполнять свои функции. Процессами, выполняемыми на аппаратном уровне, в архитектуре SiliconServer управляет на программном уровне встроенная ОС BlueArc OS. Она работает параллельно на трех отдельных процессорах, каждый из которых имеет отдельные соединения для связи с другими процессорами без нарушения потоков данных внутри системы.
Другое принципиальное отличие архитектуры SiliconServer от традиционной архитектуры серверов заключается в распределении оперативной памяти (вместо единого пула), как в сетевом коммутаторе. Память буфера отделена от управляющей памяти в каждой секции системы. Память для приема данных отделена от памяти для передачи данных, когда это имеет смысл. Каждый процессор работает с собственным выделенным пулом памяти, что устраняет задержку, обычную для серверов с симметричной многопроцессорной архитектурой.
Развитие SiliconServer — шлюз Titan 2000
В устройстве хранения BlueArc Titan 2000 (модификации — Titan 2100 и Titan 2200) используются аппаратные решения, благодаря которым и обеспечиваются высокая производительность и масштабируемость NAS. По мнению экспертов, столь мощные решения, как Titan 2000, способны наилучшим образом помочь ИТ-менеджерам решить проблему консолидации. Инженеры BlueArc приложили массу усилий, создавая это устройство хранения, аппаратная часть которого больше напоминает коммутатор корпоративного уровня, чем обычную систему NAS. В отличие от большинства решений NAS, в которых используются процессоры общего назначения с архитектурой х86 (Intel или AMD), в Titan 2000, в соответствии с архитектурой SiliconServer, для работы с сетевыми протоколами и протоколами хранения применяются запрограммированные особым образом FPGA.
Одно устройство Titan 2000 имеет в общей сложности 36 Гбайт памяти, распределенных по разным точкам системы. Микросхемы FPGA имеют собственную независимую память, что позволяет избежать появления узких мест при совместном доступе к памяти и сохранить параллельную архитектуру. Основные функции Titan 2000 реализуются с помощью FPGA. Напомним, что практически во всех других решениях NAS эти функции возложены на стандартную ОС, например, Linux или Windows Storage Server 2003.
Операции с протоколом TCP/IP выполняются микросхемами FPGA, объединенными в сетевой модуль, который имеет буфер огромного объема — 2,75 Гбайт. Сетевой модуль насчитывает шесть портов Gigabit Ethernet с уменьшенным форм-фактором SFP (Small Form Factor Pluggable). К ним можно подключать как волоконно-оптические, так и медные кабели. Четыре порта Fast Ethernet предназначены для управления по вспомогательному каналу. Одно устройство Titan 2000 способно обрабатывать трафик со скоростью до 800 Мбайт/с. Два устройства можно объединить в кластер с помощью каналов Ethernet 10 Гбит/с. Объединительный модуль поставляется с четырьмя портами Fibre Channel 4 Гбит/с, к которым подключаются устройства хранения. Общая емкость хранения устройства Titan 2100 масштабируется до 256 Тбайт, а Titan 2200 — до 512 Тбайт.
[Фото]Система Titan в стойке.
С точки зрения функциональности Titan 2000 представляет собой настоящий шлюз NAS, размещаемый перед массивами хранения Fibre Channel и управляющий их использованием. Titan 2000 может применяться в сочетании с массивами производства компаний Engenio, Sun (StorageTek), Nexsan Technologies и Xyratex. За базовые функции RAID, позволяющие избежать потери данных в случае выхода из строя отдельных дисков, отвечает внешняя система хранения. Выше этого уровня RAID Titan 2000 применяет параллельную запись с чередованием, распределяя информацию между несколькими дисковыми полками. Благодаря этому увеличивается эффективность использования дисков и повышается производительность.
Виртуальный сервер BlueArc должен облегчить ИТ-менеджерам консолидацию серверов NAS. С помощью виртуальных серверов они могут распределять ресурсы хранения устройства Titan 2000 между различными группами пользователей. Каждый виртуальный сервер имеет собственный IP-адрес и управляет независимыми участками файловых систем CIFS и NFS. В целях консолидации на одном Titan 2000 можно создавать до восьми виртуальных серверов. В кластере из двух узлов максимальное число виртуальных серверов также ограничено восемью. Но ИТ-менеджеры имеют возможность быстро переносить виртуальный сервер между узлами, если одно из устройств Titan 2000 окажется перегруженным.
Другой полезный инструмент BlueArc — средство переноса данных, с помощью которого можно распределять данные по различным уровням хранения. Действительно, имея возможность управлять системами хранения с интерфейсами Fibre Channel и Serial ATA (SATA), ИТ-менеджеры могут создать многоуровневую среду хранения, используя лишь одну систему BlueArc. Управляющая консоль Titan 2000 позволяет задать правила миграции данных, чтобы перенести старые файлы с дорогостоящих дисков Fibre Channel на недорогие диски SATA, тем самым реализовав базовые функции управления жизненным циклом информации. Корпорация опционально добавила в свой продукт поддержку WORM (однократной записи без возможности стирания или перезаписи). Это делает платформу Titan 2000 более привлекательной в глазах ИТ-менеджеров, которым необходимо сохранять данные длительное время. Для тех ИТ-менеджеров, которые обеспечивают разделяемый доступ к файлам NFS и CIFS, BlueArc предусмотрела интересный режим безопасности Mixed Mode, который позволяет клиентам, работающим с CIFS, получать доступ к файлам NFS и наоборот. В режиме Mixed Mode управляющая консоль Titan 2000 предоставляет утилиту для отображения прав клиентов, которая связывает учетные записи пользователей и помогает распределять их между системами NFS и CIFS. Кроме того, Titan 2000 может поддерживать интерфейс iSCSI. Это полезно в тех случаях, когда нужно обеспечить доступ к хранению на уровне блоков для таких чувствительных к скорости транзакций приложений, как Microsoft Exchange.
Шасси Titan 2000 имеет высоту 4U (7 дюймов) и четыре отсека, где можно разместить модули подключения устройств хранения, соединения с сетью или управления протоколами. Шасси построено на базе пассивной объединительной платы. Его пропускная способность достигает 4 Гбайт/с. Как и в других устройствах хранения высшего класса, для обеспечения избыточности шасси Titan 2000 оснащено двумя источниками питания, которые можно заменять в горячем режиме. А благодаря модульному дизайну шасси ИТ-менеджеры в будущем смогут заменять модули своих систем Titan 2000 на более мощные, чтобы увеличить их производительность и обеспечить поддержку новых технологий.
Позиционирование новых платформ
Большинство современных систем NAS предназначено для хранения и архивирования данных, к которым редко обращаются или не обращаются вовсе. Традиционные системы NAS не обеспечивают должный уровень производительности и масштабируемости для интенсивной обработки файлов, что крайне важно для таких областей, как работа с приложениями Интернет-сервисов, углубленный анализ данных, естественные науки, нефтегазовая отрасль. Накопленная база инсталляций открывает прекрасные возможности для продвижения Hitachi High-performance NAS Platform. Заказчики корпорации получили возможность работы с файловыми системами хранения, аналогичные тем, что успешно реализованы для систем хранения с блочным доступом в Universal Storage Platform. Теперь им предлагается консолидировать и виртуализовать многоуровневую среду хранения с доступом как на уровне блоков, так и файлов.
Специалисты Hitachi отмечают, что High-performance NAS Platform занимает первое место в индустрии по производительности и масштабируемости и реализует самую мощную инфраструктуру виртуализации на уровне файлов. Эта платформа превосходит по производительности, емкости, размеру файловой системы и возможностям репликации с помощью мгновенных снимков все продукты аналогичного класса для хранения файлов. Судя по опубликованным данным, она обеспечивает почти в шесть раз большую производительность при обслуживании реальных приложений, чем EMC Celerra/NSX и NetApp FAS/V (600K IOPS), предлагает вчетверо большую емкость (512 Тбайт), в 16 раз больший размер файловой системы (256 Тбайт), в четыре раза больше мгновенных снимков на файловую систему (1024). Кроме того, она реализует такие функции, как классификация данных и иерархическое управление хранением, прозрачная миграция данных.
Высокая емкость Hitachi High-performance NAS Platform позволяет уменьшить число узлов кластера и снизить расходы на обслуживание. Способность платформы объединять в один логический пул до 512 Тбайт означает, что теперь не нужно разбивать большие наборы данных на части, а ее расширенные возможности виртуализации файлов обеспечивают автоматическое масштабирование файловой системы. Когда разным исследователям требуется работать с одними и теми же данными, то вместо дорогостоящего дублирования данных платформа реализует совместный быстрый и защищенный доступ к ним с помощью центрального пула файлов и баз данных, которые способны масштабироваться до 4 млн файлов в одном каталоге. Hitachi High-performance NAS Platform также реализует кластерное пространство имен, обеспечивающее единое пространство имен одновременно для пользователей CIFS и NFS, предоставляя системным администраторам единую точку монтирования файловой системы независимо от того, где физически находятся пользователи.
По мнению президента и исполнительного директора Hitachi Data Systems Дейва Роберсона, глобальное OEM-соглашение означает стратегическое расширение круга потенциальных заказчиков корпорации. Теперь Hitachi вместе со своими партнерами по продажам может предлагать мощную, надежную и проверенную на практике технологию хранения с интенсивным обращением к файлам, которая востребована на рынке высокопроизводительных вычислений. В свою очередь, партнеры по продажам могут использовать новую систему хранения для высокопроизводительных вычислений как фундамент, добавив к которому свою экспертизу вертикальных рынков, они смогут предоставить клиентам специализированные решения.
Аналитики из Enterprise Strategy Group отмечают, что сегодня Hitachi сфокусирована на превращении в компанию сетевых систем хранения, предлагающую законченный портфель продуктов, включая системы SAN, ПО для управления хранением, цифровые архивы, VTL и NAS. Для клиентов важно, чтобы все ведущие вендоры предлагали решения NAS — это расширяет их свободу выбора. Действительно, новая NAS-платформа Hitachi дополняет мощный портфель систем хранения Hitachi Data Systems, в том числе Universal Storage Platform и Network Storage Controller, и ее системы хранения среднего класса Adaptable Modular Storage. Hitachi High-performance NAS Platform будет полностью интегрирована с ПО Hitachi для управления хранением, пакетом HiCommand, а также с пакетом для защиты и репликации данных, в том числе TrueCopy, что гарантирует не просто совместимость, но полную интеграцию всех продуктов компании для SAN и NAS.