Расширенная версия Microsoft Azure Data Lake
Компания Microsoft представила новую версию Azure Data Lake – репозитория для больших данных, который позволяет хранить информацию любого объема, обрабатывать и анализировать ее на любой платформе и на любом языке. В обновленную версию вошли облачное хранилище больших данных Azure Data Lake Store, новый аналитический сервис, служба кластеров HDInsight для платформы Linux, интегрированные инструменты разработки на Visual Studio и новые приложения Hadoop ISV.
Azure Data Lake Store – гибкое масштабируемое хранилище данных, позволяющее работать с неструктурированной, полуструктурированной и структурированной информацией. Впервые с его помощью можно собирать информацию любого типа и размера, получать доступ к ней и анализировать ее, избегая сбоев в производственных процессах и поддерживая высокий уровень безопасности сети. Платформа станет доступна пользователям в ближайшее время.
Azure Data Lake Analytics – новый сервис анализа данных, созданный на базе Apache YARN для работы в облаке. Он справляется с информацией любого масштаба, регулируя нагрузку на сеть. Модель предоставления сервиса предполагает, что клиенты будут оплачивать только те периоды, когда он использовался, а также поддержку Azure Active Directory.
Azure HDInsight – сервис, разработанный на базе Apache Hadoop и позволяющий раскручивать неограниченное количество узлов за считанные минуты. Как одно из наиболее быстро развивающихся решений в облаке Azure HDInsight предлагает пользователям широкие возможности экосистемы Hadoop в рамках легко управляемого сервиса, работу которого поддерживают специалисты Microsoft. Сегодня сервис доступен для пользователей платформы Linux, ведется работа над версией для Ubuntu.
Azure Data Lake Tools для Visual Studio, обновленные инструменты разработки, отладки и настройки пакета Visual Studio, предлагают интегрированную среду разработки, доступную для работы с SQL and .NET. А поддержка U-SQL в Azure Data Lake для Visual Studio повышает производительность средств анализа и оптимизирует процессы на тысячах узлов.
В новую редакцию Data Lake также вошел пакет приложений для управления информацией Hadoop ISV. Он включает в себя средства непрерывной аналитики больших данных, такие как Datameer, технологии защиты и управления информацией Dataguise и BlueTalon, а также DataTorrent и инструменты визуализации AtScale и Zoomdata.