Что будет с хранилищами данных в 2014 году
Повышение скорости доступа к Интернету, широкое использование ИТ-систем на рабочих местах, постоянный доступ к 3D-видео и видеороликам высокой четкости, рост популярности социальных сетей – все это приводит к тому, что создание и хранение самых разнообразных материалов в цифровом виде приобретает небывалые масштабы, а компании рискуют просто захлебнуться от избытка данных. По прогнозам аналитической компании IDC, необходимость обрабатывать быстрорастущие объемы данных приведет к тому, что с 2012 по 2017 гг. общая емкость хранилищ данных, установленных по всему миру, увеличится с 2596 до 7235 эксабайт (7,235 зеттабайт).
Крупные организации, небольшие компании и отдельные потребители сегодня все шире применяют хранилища данных и хотят мгновенно получать доступ к информации, независимо от того, где они находятся и на каких устройствах работают.
Большая часть цифровых данных по-прежнему хранится на жестких дисках. Хотя твердотельные накопители имеют более низкое энергопотребление и обеспечивают меньшее время доступа, многие отдают предпочтение жестким дискам, поскольку они все еще дешевле и имеют лучшие эксплуатационные характеристики. Гибридные твердотельные накопители (SSHD) заполняют разрыв между жесткими дисками и SSD: они объединяют возможности этих двух видов накопителей в одном устройстве и имеют хорошее соотношение цены и производительности.
Однако на выбор технологий хранения данных влияет не только тип носителя, но и география хранимой информации. Вместо того чтобы пользоваться локальными устройствами хранения данных, корпорации и индивидуальные потребители все чаще прибегают к услугам «облачных» хранилищ и обращаются к данным через Интернет.
Хранилища данных для индивидуальных потребителей
На рынке систем для индивидуальных потребителей фактическим стандартом по-прежнему остаются жесткие диски, ими оснащаются персональные компьютеры и многие ноутбуки. Хотя емкость и производительность жестких дисков постоянно растут, их эксплуатационные характеристики всегда будут зависеть от их механических компонентов. Те мне менее, несмотря на эти ограничения, на протяжении нескольких следующих лет емкость и производительность жестких дисков будут увеличиваться. Жесткие диски для ноутбуков станут легче и компактнее, будут потреблять меньше электроэнергии и создавать меньше шума при работе.
В то же время, в компьютерах и мобильных устройствах все шире применяются твердотельные накопители, с меньшим размером и более высоким быстродействием. В накопителях SSD нет ни одной движущейся части, а все данные хранятся во флэш-памяти NAND. Доступ к ней намного быстрее, чем к жестким дискам, что позволяет повысить скорость передачи данных и число операций ввода-вывода в секунду (IOPs).
Большую часть стоимости SSD составляет именно стоимость микросхем NAND. Чтобы снизить стоимость памяти NAND, производители стремятся увеличить объем данных, которые может хранить одна микросхема.
Прогнозируется, что в следующие годы стоимость SSD продолжит снижаться, а сами накопители будут использоваться в устройствах все меньшего размера. Кроме того, удешевление SSD-накопителей уже в ближайшем будущем приведет к их появлению в автомобильных информационно-развлекательных системах.
Из-за высокого спроса на микросхемы памяти большого объема скорость развития флэш-памяти NAND значительно опережала скорость развития других электронных устройств. Быстрое развитие технологий привело к тому, что сегодня на рынке широко представлены SSD-накопители, изготовленные по технологии 19 нм. Однако пределы дальнейшей их миниатюризации технологически ограничены.
Еще один способ повышения плотности записи во флэш-память состоит в увеличении числа битов, хранимых в каждой ячейке. Одноуровневая (SLC) ячейка памяти NAND может хранить один бит данных; ячейки с четырьмя возможными уровнями заряда (два бита) обычно называют многоуровневыми (MLC). Трехуровневая ячейка (TLC, Triple Level Cell) позволяет сохранять три бита данных; наконец, существуют ячейки с 16 допустимыми уровнями хранения заряда (4 бита), так называемые 16LC. Благодаря более низкой стоимости 1 Гбайт памяти ячейки типа MLC и TLC занимают все большую долю рынка. Это особенно заметно в сегменте потребительской электроники. А на рынке уже появляется память 3D NAND.
Однако срок службы SSD ограничен, и запись в ячейку каждого бита данных уменьшает количество циклов чтения-записи, которые эта ячейка сможет выполнить в будущем. Ячейка памяти типа SLC выдерживает приблизительно 100 тыс. циклов, типа MLC – от 5000 до 10000, а типа TLC – приблизительно 1000.
В процессе использования (особенно в корпоративном сегменте) SSD могут подвергаться высокой нагрузке, которую создает сохранение больших объемов данных о транзакциях. Существенно, что при этом количество операций записи будет значительно превышать количество операций чтения – а именно от частоты перезаписи данных зависит срок службы накопителя SSD.
Недавно на рынке появились твердотельные гибридные накопители SSHD (Solid State Hybrid Drive): они имеют цену и долговечность жестких дисков, но используют кэш на основе памяти NAND, который ускоряет чтение и запись. С помощью тщательно продуманных алгоритмов отбираются файлы, принадлежащие операционным системам, и другие часто используемые данные, которые и сохраняются в кэш-памяти NAND. Благодаря этому потребители получают устройство, близкое по цене к жесткому диску, но работающее почти с такой же скоростью, как SSD.
Корпоративные хранилища
Хранилища данных с многоуровневой архитектурой предполагают хранение информации с использованием как жестких дисков, так и SSD-накопителей, при этом носитель выбирается так, чтобы обеспечить максимальную эффективность работы. Постоянный рост потребностей в хранении информации и увеличении скорости доступа к ней приведет к тому, что все больше центров обработки данных и облачных серверов будут переходить к многоуровневой архитектуре.
Наиболее эффективная форма хранения определяется автоматически на основании требований к стоимости, производительности, доступности, защите и скорости извлечения. Архитектура многоуровневого хранилища использует основные преимущества жестких дисков и твердотельных накопителей корпоративного уровня (eSSD, enterprise-class solid state drive), позволяя создавать решения для хранения с учетом требуемых частоты и скорости обращения к данным.
Скорости доступа упорядочиваются по убыванию – от самой высокой на вершине пирамиды до самой низкой у ее основания. Нижний уровень включает автономные и вторичные данные, необходимые для создания архивов и обеспечения соответствия нормативным требованиям. Эти данные обычно хранятся на жестких дисках со скоростью вращения 7200 об./мин. На более высоких уровнях будут храниться данные, необходимые важным коммерческим приложениям, и информация, которая должна быть доступна в режиме реального времени. На этих уровнях применяются более быстрые жесткие диски со скоростью вращения 10 000 об/мин. На вершине пирамиды находятся накопители eSSD, обеспечивающие очень высокую скорость доступа и используемые для хранения наиболее важной информации, к которой приходится часто обращаться.
Сочетание большой емкости жестких дисков и присущей SSD высокой скорости чтения с произвольным доступом предоставляет удобные возможности оптимизировать работу как с важными коммерческими данными, так и с мультимедийными файлами большого объема. При этом жесткие диски образуют основу решения, предоставляя большой объем пространства для хранения данных, а SSD дополняют его, обеспечивая быстрый доступ к наиболее важной информации.
Многоуровневые системы хранения проектируются таким образом, чтобы минимизировать энергопотребление путем передачи данных в наиболее подходящий «раздел» или «слой» хранения. Оптимальный выбор носителей для хранения и извлечения данных позволяет добиться минимального энергопотребления и тепловыделения, что очень важно для корпоративных дата-центров.
Хранилища больших объемов данных
Все большему числу коммерческих, государственных и научных учреждений приходится использовать обширные объемы данных, которые невозможно сохранять, анализировать и обрабатывать с помощью распространенных программных средств. Например, в ходе экспериментов, проводившихся на Большом адронном коллайдере, ежедневно создавалось более 500 эксабайт данных, хотя каждый год сохраняется «всего» 25 петабайт. А хранилище данных компании eBay содержит до 90 петабайт данных и используется не только для ускорения транзакций, но и для анализа тенденций и информации о заказчиках.
Сбор и сохранение информации для проектов, оперирующих большими объемами данных, – это лишь первый шаг. Сегодня многие такие проекты еще находятся на начальном этапе развития и используют данные из традиционных источников, не обрабатывая видеоматериалы и информацию, полученную по электронной почте, из социальных сетей или с помощью датчиков. Однако по мере развития этим проектам потребуются более мощные средства анализа и более быстрый доступ к данным.
Многие поставщики облачных услуг предлагают услуги вычислений в памяти (In-Memory Computing, IMC), позволяющие за минуты или даже за секунды выполнять процессы пакетного анализа, которые ранее требовали нескольких часов. Снижение стоимости быстрых накопителей SSD расширяет возможности компаний, предоставляющих услуги IMC, и способствует распространению этих услуг.
Согласно прогнозам, в 2014 г. возрастет популярность вычислений в памяти и активизируется разработка стандартов, способных уменьшить сложность архитектуры.
* * *
Потребности в хранении данных будут непрерывно расти, а всем потребителям – как корпоративным, так и индивидуальным – будет нужен более быстрый и удобный доступ к данным. Регулярно используемые данные будут все чаще переноситься на устройства, оснащенные памятью NAND, а для размещения архивов и редко используемых данных, подлежащих долговременному хранению, будут применяться многоуровневые системы.