Программа поддержки движка запросов Presto в Teradata

--> Дата: Июл 18, 2015 77

Компания Teradata объявила о начале многолетней программы развития разработки с открытым кодом Presto – первой в отрасли коммерческой поддержки этого проекта. Основываясь на принятом трехступенчатом плане, Teradata вложится в проект open source под лицензией Apache, который обеспечит улучшенные характеристики современной базы кодов Presto, улучшит масштабируемость, итерационные запросы, а также возможность направлять запросы одновременно в несколько репозиториев данных.

Разрабатываемый и используемый Facebook, Presto представляет собой мощный open source-движок SQL-запросов следующего поколения, поддерживающий аналитику big data. На его использование перешли ряд ведущих компаний в своих областях, в том числе Airbnb, DropBox, Gree, Groupon, Netflix.

Presto дополняет собой программное решение Teradata QueryGridTM и вписывается в идеологию Teradata Unified Data Architecture. Этот движок обеспечивает пользователям возможность инициировать запросы напрямую из Hadoop, в то время как Teradata QueryGrid позволяет инициировать запросы из Teradata Database и Teradata Aster Database посредством обычного SQL-протокола.

Presto работает на нескольких Hadoop-дистрибутивах; кроме того, он может непосредственно из Hadoop-платформы отправлять запросы в Cassandra, реляционные базы данных или частные хранилища данных. Эта кросс-платформенная аналитическая характеристика дает возможность пользователям Presto извлекать максимум бизнес-ценности из «озер данных» любого размера, исчисляемых гига- или петабайтами.

Трехэтапный проект инвестиций Teradata в open source-решение расширит корпоративный функционал Presto. Первый этап предполагает усовершенствование базовых функций, упрощающих ввод Presto, включая инсталляцию, изучение сопроводительной документации, а также базовый мониторинг. На втором этапе планируется интеграция Presto вместе с другими ключевыми компонентами экосистемы big data, такими, как стандартный Hadoop-дистрибутив инструментов управления, операционная совместимость с YARN, а также коннекторы, расширяющие охват функционала Presto за пределы файловой системы Hadoop distributed file system (HDFS). Эти возможности будут доступны в конце 2015 г. И третий этап – запуск архитектуры ODBC (Open Database Connectivity) и интерфейса JDBC (Java Database Connectivity API, взаимодействие Java и баз данных по API) для расширения возможностей адаптации Presto организациями и усиления интеграции с инструментами бизнес-аналитики. Будет также улучшена защищенность за счет доступа по модели распределенных служебных ролей. Эти расширения будут доступны в 2016 г.