Бот Сбера для текстовой расшифровки аудиофайлов
Компания SberDevices объявила о запуске бесплатного бота в Telegram, который конвертирует голосовые сообщения на русском языке в текстовый формат. Бот работает на основе технологии распознавания речи SmartSpeech и рассчитан на журналистов, копирайтеров, переводчиков и представителей других профессий, которые работают с текстами. Он позволит сэкономить время, сократить рутину в работе и повысить эффективность при производстве контента.
Бот можно использовать как в личной переписке, так и добавлять в групповые чаты. Он обеспечивает расшифровку голосовых сообщений и загруженных одноканальных аудиофайлов на русском языке до 20 Мбайт в кодировках MP3, WAV (8-96 кГц), FLAC и OggOpus.
Голосовое сообщение или файл преобразуются в текст с помощью технологии распознавания речи (Automatic Speech Recognition, ASR) платформы SmartSpeech от SberDevices. Технология может применяться бизнесом в интерфейсах голосового ввода, например, на веб-сайтах.
В SmartSpeech есть также функция генерации речи, за нее отвечает технология Text to speech (TTS). Она позволяет озвучивать любые тексты и создавать звуковые ролики. Благодаря синергии этих технологий с помощью сервиса можно внедрить интерактивное голосовое меню (IVR), подключить голосового ассистента, использовать платформу в чатах и рекламных продуктах, озвучивать контент и команды голосового ввода.
Платформа SmartSpeech ориентирована на компании разных размеров и направлений деятельности. В Сбере ее технологии применяются, в частности, в работе семейства виртуальных ассистентов Салют.