Project DataWorks: интеграция работы с данными в IBM Cloud
Корпорация IBM запустила Project DataWorks – проект направления Watson, представляющий собой первую в индустрии облачную платформу для обработки и анализа данных, которая объединяет все типы данных и позволяет принимать решения с использованием искусственного интеллекта. Project DataWorks упрощает для руководителей и специалистов по анализу данных процессы сбора, систематизации, управления и обеспечения безопасности данных. Это, в свою очередь, позволит им получить необходимые инсайты с целью когнитивной трансформации бизнеса компаний.
Процесс получения подобных инсайтов – непростая задача, большую часть этой работы выполняют высококвалифицированные профессионалы в области обработки данных, действующие разобщенно. Они используют несвязанные инструменты и сервисы для работы с данными, которые сложно контролировать, интегрировать и регулировать. Кроме того, поскольку информация не остается статичной, предприятия должны постоянно и часто вручную улучшать свои модели и продукты для обработки данных, чтобы получать наиболее релевантные ценные сведения.
Project DataWorks поможет предприятиям объединить на единой платформе все данные и инсайты. Специалисты по обработке данных смогут работать сообща на интегрированной платформе в режиме самообслуживания, обмениваясь общими наборами данных и моделями в безопасном режиме. Это обеспечит более эффективное управление всеми процессами при увеличении скорости итераций проектов на основе данных.
Новый проект, доступный на Bluemix, облачной платформе IBM Cloud, позволит пересмотреть модель совместной работы специалистов по обработке данных при помощи ряда ключевых инноваций, таких как Apache Spark, IBM Watson Analytics и IBM Data Science Experience. Благодаря этому проекту организации смогут:
• автоматизировать развертывание информационных активов и устройств обработки данных с использованием когнитивного машинного обучения и Apache Spark;
• собирать данные со всех источников быстрее любого современного решения на рынке, со скоростью от 50 до сотен Гбит/с: корпоративных баз данных, интернета вещей, источников потоковой передачи, метеорологических данных и социальных сетей;
• эффективно использовать открытую экосистему, включающую более 20 партнеров и такие технологии, как Confluent, Continuum Analytics, Galvanize, Alation, NumFOCUS, RStudio, Skymind и другие.
Project DataWorks также опирается на ключевые когнитивные способности, например, когнитивное машинное обучение. Это позволяет ускорить все процессы, начиная с обнаружения данных до развертывания моделей, и поможет пользователям получить недоступные им ранее инсайты.
Новая платформа разработана на основе подхода, который ранее использовала The Weather Company, компания IBM. Этот подход призван помочь пользователю получить ценные сведения, оказывающие влияние на повседневное принятие решений как для бизнеса, так и для покупателей. Платформа включает в себя гибкую архитектуру данных, быструю обработку множественных источников информации, в том числе интернет-источников.