Компания Жижи внедрила голосовой ввод в свою платформу для ИИ-поиска
Компания ЖИЖИ, разработчик решений в области обработки естественного языка и интеллектуального анализа данных, сообщает о внедрении технологии голосового ввода в программный интерфейс своей платформы. Новый функционал доступен как в мобильном приложении, так и в десктопной версии продукта.
Технические аспекты решения
Система голосового ввода реализована по следующему принципу: аудиопоток с устройства пользователя фиксируется в виде звукового файла и передается на серверную инфраструктуру «ЖИЖИ». Там аудиоданные обрабатываются нейросетевой моделью, построенной на архитектуре encoder‑decoder.
Модель проводит ряд последовательных операций: преобразование аудиосигнала в спектрограмму, извлечение смысловых признаков речи и декодирование этих признаков в текстовую последовательность. Архитектура encoder‑decoder обеспечивает сопоставление акустических паттернов с лингвистическими единицами, что позволяет распознавать произносимый контент независимо от индивидуальных особенностей дикции пользователя.
Инженерная реализация цепочки обработки ориентирована на минимизацию задержек: от момента завершения записи до получения текстового транскрипта проходит время, не превышающее установленных для синхронного взаимодействия пороговых значений.
Практическое применение
Голосовой ввод расширяет сценарии использования платформы ЖИЖИ: пользователи получают возможность формулировать поисковые запросы и аналитические задачи устно, что актуально при работе в условиях ограниченной мобильности либо при необходимости оперативной фиксации мыслей. Функциональность идентична в мобильной и десктопной средах, что обеспечивает непрерывность пользовательского опыта при переходе между устройствами.
«Распознавание речи является естественным дополнением к текстовому интерфейсу работы с информацией», — прокомментировал развитие продукта Григорий Антонов, технический директор и сооснователь компании «ЖИЖИ». «Архитектура encoder‑decoder позволила нам построить надежное и быстрое решение, которое вписывается в существующую экосистему платформы без дополнительных требований к пользовательскому оборудованию».