Облачная ИИ-платформа 3iTech для обработки голоса

--> Дата: Янв 29, 2024 191

3iTech Искусственный интеллект (AI)Колл-центры Распознавание/синтез речи (ML SpeechToText / TextToSpeech)

Компания 3iTech, российский вендор решений на базе ИИ для бизнеса, выпустила облачную платформу 3i VoxKit 2.0 для создания продуктов на основе речевых технологий. Платформа рассчитана на решение бизнес-задач, в которых требуется распознавать, понимать и идентифицировать речь. Это, например, озвучивание видеороликов, аудиокниг, инструкций, интерфейсов сайта, создание голосовых роботов и ассистентов, способных общаться на естественном языке, протоколирование совещаний и онлайн-конференций, идентификация клиентов по голосу для защиты бизнеса от фрода, создание субтитров для ТВ-передач, подкастов, эфиров и видеофильмов. 3i VoxKit 2.0 также поможет в создании решений для автоматизации анализа клиентских коммуникаций и контроля качества обслуживания.

Платформа работает с речью в потоковом и отложенном режимах, умеет распознавать пол, возраст и эмоции говорящего. Сегодня она позволяет синтезировать речь на русском и казахском языках одним из четырех голосов дикторов, в ближайшее время добавится также узбекский. Распознавание речи доступно на русском, казахском, узбекском и английском языках.

Как поясняют в компании, первая версия 3i VoxKit была выпущена в 2020 году и использовалась в том числе на телевидении. На полный перезапуск системы и выпуск второй версии ушло два года исследований и разработок.

В планах 3iTech до конца 2024 г. довести до десяти число профессиональных голосов дикторов, которые могли бы использоваться в контакт-центрах клиентов компании.Кроме того, 3iTech начинает оказывать услугу создания синтезированного голоса на заказ на турецком, азербаджанском, китайском, арабском и других языках.

3iTech Искусственный интеллект (AI)Колл-центры Распознавание/синтез речи (ML SpeechToText / TextToSpeech)