Обновленные модели GigaChat от Сбера
Сбер представил новую версию своей нейросетевой модели – весь модельный ряд GigaChat 2.0 получил существенный апгрейд. GigaChat 2 MAX стал еще мощнее и, как подчеркивают в компании, уверенно опережает многие зарубежные аналоги в задачах на русском языке. GigaChat 2 Pro демонстрирует качество на уровне предыдущей версии MAХ и справляется с задачами, в которых важны креатив и точность, при этом сама модель менее требовательна к ресурсам. GigaChat 2 Lite – базовая модель для решения легких задач – по качеству теперь сопоставима с предыдущей версией Pro: на ней можно быстрее и выгоднее решать сложные задачи.
Пользователи сохраняют доступ к моделям первого поколения и могут протестировать GigaChat 2.0, прежде чем перейти на новый модельный ряд. Чтобы подобрать оптимальную для своего бизнеса версию GigaChat и промпты для нее, необязательно разбираться в программировании, поясняют в Сбере. Вся линейка доступна бизнесу в облаке через API, ее также можно развернуть локально в инфраструктуре компании (on-premise).
На базе GigaChat 2.0 компании смогут создавать более продуктивных автономных помощников (AI-агенты), способных рассуждать и самостоятельно решать сложные многокомпонентные задачи. Это стало возможным, поскольку модели увеличили свои знания в математике, естественных и гуманитарных науках, научились лучше программировать и писать более качественный код. Для разработки агентов на Python и JS можно использовать SDK LangChain, с которым GigaChat полностью совместим. Пакеты совместимости – в публичном репозитории GigaChain.
Модели нового поколения дольше удерживают контекст беседы, отвечают на сложные длинные вопросы и анализируют больше текста. Если раньше в один запрос можно было загрузить примерно 48 страниц A4 с текстом (шрифт 14 pt), то теперь максимальный объем запроса вырос почти до 200 страниц. Поэтому с GigaChat 2.0 удобнее создавать чат-ботов.
Новые модели, по данным компании, в два раза точнее следуют инструкциям пользователя и на 25% лучше отвечают на вопросы: соблюдают заданные форматы и условия, формируют ответы в определенном стиле, что помогает эффективнее решать рабочие задачи: готовить сопроводительную правовую документацию, анализировать обращения клиентов и т. д.
По данным независимого бенчмарка MERA для русского языка, которые приводит Сбер, GigaChat 2 MAX занимает первое место среди AI-моделей, а по результатам бенчмарков формата MMLU на русском и английском языках новый модельный ряд не уступает показателям мировых лидеров или даже превосходит их. Лучшие результаты показала флагманская модель линейки. По сравнению с DeepSeek-V3, Qwen2.5 (версия Qwen-2.5-75b), GPT4o и LLaMA 70B GigaChat 2 MAX лучше отвечает на фактологические вопросы на русском языке и следует заданному формату. Модель также опережает зарубежные аналоги на бенчмарке для оценки кодовых способностей HumanEval и более глубоко разбирается в точных науках.