Приложение SaluteSpeech для работы с речевыми технологиями
Сбер сообщил о запуске отдельного приложения для работы с речевыми технологиями – SaluteSpeech App. Это новый инструмент для распознавания аудио и озвучивания текста. Приложение доступно для всех популярных ОС, отличается простотой использования и включает в себя возможности GigaChat API, программного интерфейса доступа к сервису GigaChat.
В SaluteSpeech App имеется два раздела, каждый из которых соответствует своей технологии. Раздел «Распознавание» предназначен для текстовой расшифровки встреч, звонков, интервью и любых других голосовых файлов. Раздел «Синтез», наоборот, позволяет озвучить текст, настраивая паузы и ударения, и скачать готовый аудиофайл на свое устройство. Синтезировать текст можно разными голосами из семи общедоступных вариантов на русском и английском языках.
Использование GigaChat API упрощает процесс подготовки аудиоконтента. Пользователь может загрузить короткие тезисы и попросить нейросетевую модель на их базе подготовить необходимый текст для последующего синтеза. С помощью GigaChat API в приложении SaluteSpeech App также можно сделать короткую выжимку протокола встречи, аналитического отчета или любого другого текста, а затем озвучить полученный материал. Есть множество и других кейсов.
Новое приложение будет доступно всем без оплаты и подойдет для решения самых разных задач. Например, журналисты могут быстро расшифровать интервью, авторы книг – озвучить свои произведения, разработчики приложений с голосовыми командами – создавать для них голосовые дорожки, студенты – расшифровывать лекции и др.
Для начала работы с SaluteSpeech App пользователю необходимо скачать приложение, перейти в нем по ссылке для создания проекта SaluteSpeech и GigaChat, далее перенести свои авторизационные данные из соответствующего проекта в приложение SaluteSpeech App.