Byte/RE ИТ-издание

Бот Сбера для текстовой расшифровки аудиофайлов

Компания SberDevices объявила о запуске бесплатного бота в Telegram, который конвертирует голосовые сообщения на русском языке в текстовый формат. Бот работает на основе технологии распознавания речи SmartSpeech и рассчитан на журналистов, копирайтеров, переводчиков и представителей других профессий, которые работают с текстами. Он позволит сэкономить время, сократить рутину в работе и повысить эффективность при производстве контента.

Бот можно использовать как в личной переписке, так и добавлять в групповые чаты. Он обеспечивает расшифровку голосовых сообщений и загруженных одноканальных аудиофайлов на русском языке до 20 Мбайт в кодировках MP3, WAV (8-96 кГц), FLAC и OggOpus.

Голосовое сообщение или файл преобразуются в текст с помощью технологии распознавания речи (Automatic Speech Recognition, ASR) платформы SmartSpeech от SberDevices. Технология может применяться бизнесом в интерфейсах голосового ввода, например, на веб-сайтах.

В SmartSpeech есть также функция генерации речи, за нее отвечает технология Text to speech (TTS). Она позволяет озвучивать любые тексты и создавать звуковые ролики. Благодаря синергии этих технологий с помощью сервиса можно внедрить интерактивное голосовое меню (IVR), подключить голосового ассистента, использовать платформу в чатах и рекламных продуктах, озвучивать контент и команды голосового ввода.

Платформа SmartSpeech ориентирована на компании разных размеров и направлений деятельности. В Сбере ее технологии применяются, в частности, в работе семейства виртуальных ассистентов Салют.

Вам также могут понравиться