Облачная ИИ-платформа 3iTech для обработки голоса
Компания 3iTech, российский вендор решений на базе ИИ для бизнеса, выпустила облачную платформу 3i VoxKit 2.0 для создания продуктов на основе речевых технологий. Платформа рассчитана на решение бизнес-задач, в которых требуется распознавать, понимать и идентифицировать речь. Это, например, озвучивание видеороликов, аудиокниг, инструкций, интерфейсов сайта, создание голосовых роботов и ассистентов, способных общаться на естественном языке, протоколирование совещаний и онлайн-конференций, идентификация клиентов по голосу для защиты бизнеса от фрода, создание субтитров для ТВ-передач, подкастов, эфиров и видеофильмов. 3i VoxKit 2.0 также поможет в создании решений для автоматизации анализа клиентских коммуникаций и контроля качества обслуживания.
Платформа работает с речью в потоковом и отложенном режимах, умеет распознавать пол, возраст и эмоции говорящего. Сегодня она позволяет синтезировать речь на русском и казахском языках одним из четырех голосов дикторов, в ближайшее время добавится также узбекский. Распознавание речи доступно на русском, казахском, узбекском и английском языках.
Как поясняют в компании, первая версия 3i VoxKit была выпущена в 2020 году и использовалась в том числе на телевидении. На полный перезапуск системы и выпуск второй версии ушло два года исследований и разработок.
В планах 3iTech до конца 2024 г. довести до десяти число профессиональных голосов дикторов, которые могли бы использоваться в контакт-центрах клиентов компании.Кроме того, 3iTech начинает оказывать услугу создания синтезированного голоса на заказ на турецком, азербаджанском, китайском, арабском и других языках.