EMC Data Lake 2.0 для анализа данных и цифровой экономики
Корпорация EMC представила решение Data lake 2.0 на базе платформы EMC Isilon, которое должно стать ключевым фактором перехода от классического подхода ИТ к цифровой экономике. EMC Isilon Data Lake 2.0 объединяет все данные компании в единый репозиторий, оптимизирует работу с неструктурированными данными и служит фундаментом для аналитики данных.
По результатам исследования EMC, 99% мировых данных представляют собой сырые данные. В большинстве случаев эта информация не используется данные складируются, архивируются или просто уничтожаются. Но цифровая экономика – драйвер развития современного общества – полностью основана на данных и постепенно охватывает все новые отрасли: промышленность, транспорт, науку. Она позволяет существенно поднять производительность труда за счет новых подходов в работе персонала и мобильных приложений и уменьшить расходы благодаря сбору и анализу информации, в том числе анализа с предсказанием.
Рост данных, множественность подходов к их обработке требуют новой архитектуры хранения, которая позволит аккумулировать разрозненные данные в едином репозитории и предоставлять доступ к различным способам их обработки прозрачно и без дополнительных затрат. Эта концепция получила название «Озера данных 2.0» (Data Lake 2.0). Идея заключается в том, что у компаний появляется единое информационное пространство (озеро), где хранятся все данные компании, и оно должно стать универсальным инструментом для хранения информации и последующей аналитики.
Фундаментом Data Lake 2.0 служит новое поколение флагманской платформы EMC Isilon. Основные отличия новой платформы – расширение «озера данных» за пределы ЦОД заказчиков: теперь оно включает в себя и данные филиалов (удаленных офисов), и данные в облаке. EMC Isilon сочетает в себе весь функционал озера данных с функционалом корпоративных СХД и имеет интегрированную поддержку HDFS (интегрированный в операционную систему уровень хранения Hadoop).