Система IBM для оперативной аналитики данных
Компания IBM объявила о запуске Integrated Analytics System – новой единой системы обработки данных. Она предоставляет быстрый и простой доступ к возможностям анализа информации и позволяет работать с данными в частных, публичных или гибридных облачных средах.
Система сочетает различные инструменты обработки данных и позволяет специалистам оперативно разрабатывать и развертывать инновационные аналитические модели непосредственно в хранилище данных, тем самым повышая производительность. Система создана на базе IBM Common SQL Engine, поэтому заказчики могут использовать его для перемещения рабочих задач в публичное облако. Кроме того, она позволяет провести автоматизацию бизнеса с помощью машинного обучения. Популярный механизм СУБД используется в локальных и облачных базах данных, поэтому пользователи могут перемещать данные и направлять запросы во всем разнообразии хранилищ информации, таких как Db2 Warehouse on Cloud или Hortonworks Data Platform.
Основные составляющие Integrated Analytics System – решения IBM Data Science Experience, Apache Spark и Db2 Warehouse. Все они были оптимизированы для совместной работы. Data Science Experience предлагает набор инструментов обработки критически важных данных и совместное рабочее пространство, с помощью которого специалисты могут создавать новые аналитические модели. В свою очередь, разработчики могут использовать такие модели для быстрого построения умных приложений. Включение Apache Spark, известного фреймворка с открытым исходным кодом, позволяет обрабатывать данные в оперативной памяти. Такой подход ускоряет работу аналитических приложений благодаря тому, что информация обрабатывается непосредственно в месте ее хранения.
Новая особенность этого класса решений – возможности машинного обучения, которые интегрированы в систему наряду с Data Science Experience и Spark. Благодаря этому информацию не нужно перемещать для проведения анализа, что сокращает время простоя из-за ожидания запуска и отклика аналитической системы. Такой подход упрощает процесс обучения и оценки прогнозных моделей, а также их тестирования и развертывания, поскольку все происходит в единой системе.
Интегрированная архитектура новой системы сочетает функции ПО, такие как ассиметричная массово-параллельная обработка данных (AMPP), с технологией IBM Power и аппаратными средствами хранения на основе флэш-памяти. Система построена на базе IBM PureData System for Analytics и предыдущих решений в области хранилищ данных IBM Netezza. Она поддерживает широкий набор типов и сервисов данных, начиная от Watson Data Platform и IBM Db2 Warehouse On Cloud до Hadoop и IBM BigSQL. Подобно этим решениям, Integrated Analytics System построена на базе IBM Common SQL Engine, что позволяет заказчикам легко объединять локальную систему и облачные хранилища. Кроме того, стандартные отраслевые инструменты и стандартный механизм SQL позволяют перемещать рабочие нагрузки в публичные или частные облака с помощью кластеров Spark с учетом требований пользователя.
Как и все существующие хранилища данных IBM, Integrated Analytics System предлагает встроенную виртуализацию данных и совместимость с Netezza, Db2 и IBM PureData System for Analytics.
Помимо перечисленных возможностей, новая система также обеспечивает гибридную транзакционно-аналитическую обработку (HTAP). В отличие от обычных бизнес-сред, где такие процессы запускаются на базе отдельных архитектур, HTAP управляет прогнозной аналитикой, транзакционной и архивной информацией в единой базе данных с ускоренным временем ответа. Позднее в этом году компания планирует добавить поддержку HTAP на IBM Db2 Analytics Accelerator for z/OS, что упростит интеграцию системы с инфраструктурой IBM z Systems.