Повышение эффективности дисковых массивов с помощью PAM
Одним из двух лидеров рынка дисковых массивов среднего класса аналитики Gartner называют компанию Network Appliance (NetApp). Ее решения позволяют унифицировать ИТ-инфраструктуру путем объединения систем хранения различных типов доступа в одном дисковом устройстве хранения данных. Устройства NetApp FAS (Fabric-Attached Storage) легко интегрируются в сложные информационные системы уровня предприятия и предоставляют весь спектр способов доступа к данным для сред Unix, Windows и Linux, одновременно поддерживая интерфейсы Fibre Channel SAN, IP SAN (iSCSI) и файловый доступ NAS по протоколам CIFS (Windows) и NFS (Unix/Linux). Системы хранения NetApp имеют подтвержденную надежность хранения при доступности 99,99%, масштабируются от десятков гигабайт до петабайт и используют накопители с интерфейсом как Fibre Channel, так и Serial ATA (SATA).
Базовая линейка дисковых хранилищ NetApp представляет собой три семейства универсальных масштабируемых систем: Series 2000 — модели начального уровня; Series 3000 — системы уровня предприятия и Series 6000 — системы для решения задач крупных предприятий и центров обработки данных (ЦОД). Стоит отметить, что системы FAS состоят из дисковых полок и управляющего модуля (контроллера), на котором установлены процессоры с собственной памятью.
Контроллеры V-Series (рис. 1) позволяют объединить в одной архитектуре дисковые хранилища не только от самой NetApp, но и от других фирм-производителей, включая системы EMC, IBM, HP и HDS. Кроме того, пользователи данной серии контроллеров теперь могут использовать массивы RamSan-500 компании Texas Memory Systems, которые базируются на твердотельных накопителях типа SSD-Flash. Сочетание контроллера V-Series с RamSan-500 задействует все преимущества ОС Data ONTAP при работе с твердотельными накопителями для улучшения производительности. Для более эффективного использования массивов хранения NetApp предлагает также устройство Performance Acceleration Module (PAM).
Впервые компания представила модуль PAM (рис. 2) вместе с моделями дисковых массивов FAS3100. Как отмечают представители NetApp, PAM предлагает особый путь оптимизации производительности систем хранения за счет улучшения параметров пропускной способности и времени задержки при одновременном сокращении количества дисковых шпинделей. Это, в свою очередь, снижает требования по мощности, охлаждению и необходимому стоечному пространству.
Физически первый вариант PAM представлял собой х4 PCI-Express плату с габаритными размерами «три четверти» (от полноразмерной). На этом модуле было организовано два канала прямого доступа DMA (Direct Memory Access) к 16 Гбайт оперативной памяти DDR2 SDRAM, которая используется как кэш-память чтения. Вторая версия PAM – PAM II поддерживает уже от 256 до 512 Гбайт флэш-памяти (SLC NAND), расположенной на плате с интерфейсом x8 PCI Express. Содержимое установленной на плате перепрограммируемой вентильной матрицы позволяет ускорить задачи кэширования. Максимальное энергопотребление всего устройства составляет 25 Вт, а типичное же не превышает 18 Вт, что составляет 95% потребления дисковой полки, заполненной дисками Fibre Channel со скоростью вращения 15 RPM (Revolutions Per Minute). Это экономит за год 3 тыс. кВт.ч энергопотребления и 3U стоечного пространства.
Интеграция устройства с ОС DataONTAP обеспечивается специальным ПО FlexScale, которое предоставляет различные варианты настройки и режимы работы. По сути РАМ представляет собой кэш-память второго уровня (рис. 3) для хранения блоков данных, удаленных из буферного кэша внутренней файловой системы WAFL (Write Anywhere File Layout), которая определяет, как располагаются данные на диске. Отметим, что этот буферный кэш организован в оперативной памяти контроллера дискового массива. Таким образом, в отличие от дисков SSD, которые ускоряют доступ только к данным, сохраненным на накопителях этого типа, PAM II увеличивает эффективность буферной кэш-памяти для всей системы.
Как известно, в любом дисковом массиве процессоры имеют доступ к данным в двух областях: на дисках и в кэш-памяти. В свою очередь, именно диск является самой медленной частью и наиболее «слабым» звеном массива. В частности, высокая латентность диска означает, что извлечение с него данных требует на порядок больше времени, чем их извлечение из памяти. Чтобы оптимизировать работу приложений, характеризуемых интенсивными операциями ввода-вывода с произвольной выборкой и очень чувствительных к латентности, конфигурируют большое число дисков. Стоит отметить, что многие приложения Microsoft попадают именно в эту категорию. Подобные типы нагрузки создают также платформы виртуализации VMWare и файловые сервисы.
В системах без РАМ любая попытка прочесть данные, которых нет в оперативной памяти, приводит к операции чтения с диска. При наличии РАМ система сначала проверяет наличие запрошенных данных во всех установленных кэш-модулях и только при отрицательном результате приступает к чтению с диска. ОС DataONTAP, обслуживающая набор кэш-тегов в системной памяти, может определить, находится ли запрошенный блок в РАМ, без физического доступа к самой плате. Это сокращает задержку доступа, поскольку при попадании в кэш требуется только одна операция прямого доступа к памяти DMA. Как при организации любой кэш-памяти, ключ к успеху кроется в используемых алгоритмах, которые и решают, что попадает в кэш.
Когда модуль работает как кэш чтения, некорректируемые ошибки просто отбрасываются, а требуемые данные считываются прямо с диска. Если частота подобных ошибок превышает установленный порог, модуль автоматически отключается, а система переводится в режим некэшируемых операций, причем для этого не требуется прерывание обслуживания или перезагрузка. Механизм ECC (Error Correction Code) используется для обнаружения и исправления ошибок, в то время как контроль избыточным цикличным кодом CRC (Cyclic Redundancy Check) защищает данные, передаваемые от памяти к процессору и в обратном направлении.
В тестах SPECsfs2008 дисковый массив FAS3140, оснащенный модулем РАМ, продемонстрировал ряд преимуществ, которые имеют особое значение для среды дата-центров. Так, тот же самый уровень производительности теперь достигается на половине ранее требуемых дисков (шпинделей), что ведет к падению цены массива на 27%, сокращению стоечного пространства на 44% и уменьшению расхода электроэнергии на 47–54%. Более того, емкость хранения можно увеличить до 75% на недорогих SATA-дисках, также используя половину их прежнего количества. При этом достигается такой же уровень эффективности, как на FC-накопителях, которые являются типичным решением для среды ЦОД. Таким образом, экономится драгоценное пространство дата-центра. Удается также улучшить на 35% время отклика для FC-дисков, уменьшив их количество вдвое, при наличии только одного модуля РАМ.