Модель YandexGPT Lite третьего поколения
Компания «Яндекс» сообщила о запуске YandexGPT 3 Lite – облегченной версии собственной генеративной нейросети третьего поколения. Она будет доступна клиентам облачной платформы Yandex Cloud через API. Новая модель полезна в сценариях, где важна скорость ответа: например, ее можно использовать в чат-ботах, для проверки орфографии или анализа данных. По заявлению компании, это оптимальная по цене и качеству коммерческая модель Яндекса для решения рутинных задач.
YandexGPT 3 Lite подходит для разных типов бизнеса, от небольших компаний до крупных организаций. С ее помощью можно оптимизировать такие задачи, как консультация клиентов в чате и по телефону, подготовка ответов для службы поддержки, создание маркетинговых материалов или дайджеста рабочих встреч. Крупные компании со сложными бизнес-процессами и большим потоком информации могут применять ее для анализа данных, необходимых для принятия решений.
Новая модель по многим параметрам превосходит облегченную модель предыдущего поколения YandexGPT 2 Lite. По итогам теста YaMMLU_ru (русскоязычной версии международного эталонного теста MMLU), новая модель дает на 6 п. п. больше верных ответов, чем модель предыдущего поколения.
Модели сравнивали также по методике Side by Side: нейросети отвечали на одни и те же вопросы, а эксперты выбирали лучший ответ. В среднем YandexGPT 3 Lite отвечала лучше, чем YandexGPT 2 Lite, в 68% случаев. Эксперты оценивали также, насколько хорошо новая модель справляется с задачами классификации, генерации контента, ответами на вопросы и другими основными типами бизнес-задач. Кроме того, новая модель допускает меньше орфографических и фактических ошибок, чем YandexGPT 2 Lite.
Для создания новой модели разработчики усовершенствовали все этапы обучения, в частности, улучшили отбор данных для предварительного этапа обучения (pretraining), повысив долю полезной информации. Кроме того, на этом этапе они стали использовать технологию curriculum learning, позволяющую поэтапно усложнять данные. На втором этапе обучения (alignment, или выравнивание модели), включающем обучение с подкреплением (reinforcement learning), улучшили модель для оценки качества ответов нейросети. Кроме того, в архитектуру нейросети добавили технологию Grouped Query Attention – она ускоряет обработку данных без потери качества.
YandexGPT 3 Lite можно интегрировать в свои продукты через API в сервисе Foundation Models. Новая модель заменит предыдущую в течение месяца, но попробовать ее можно уже сейчас. Стоимость использования YandexGPT 3 Lite – 20 коп. за тысячу токенов. Новые пользователи Yandex Cloud смогут бесплатно протестировать ее в деморежиме.