Byte/RE ИТ-издание

GigaChat 2.0 от Сбера – для всех пользователей

Сбер объявил о том, что GigaChat 2.0 стал доступен каждому пользователю. Благодаря новому подходу к обучению существенно повысился уровень всех навыков модели. Искусственный интеллект научился распознавать голосовые аудиофайлы, глубже анализировать запросы пользователя, обрабатывать больший объем текста и распознавать изображения. Все возможности GigaChat доступны в одном продукте и на любой поверхности, так что пользователю не нужно переключаться между разными сервисами.

В модельный ряд вошли две версии на выбор пользователя – GigaChat 2 Pro и GigaChat 2 Max. Max – это самая продвинутая модель для решения сложных и профессиональных задач, а Pro подойдет для быстрого и качественного решения повседневных задач, от получения ответов на различные вопросы до создания и редактирование текстов.

Сервис GigaChat 2.0 теперь умеет работать с актуальными данными из интернета, глубже анализирует запросы, выдавая лаконичные ответы с ссылками на источники. Искусственный интеллект найдет информацию за человека, отфильтрует главное и подкрепит свои выводы ссылками, на случай что пользователю понадобится дополнительная информация. Также в одном диалоге доступна работа с несколькими файлами. В чат можно загрузить документ до 200 страниц текста А4.

GigaChat 2.0 обрабатывает аудиофайлы на принципиально новом уровне – модель воспринимает звуковые данные напрямую, без промежуточного преобразования в текст. Это позволяет точнее выделять главное и отвечать на вопросы по содержанию – достаточно приложить запись и сформулировать запрос. Поддерживаются файлы длительностью до 60 мин и 30 Мбайт. А если печатать неудобно или нет возможности, можно записать голосовое сообщение. GigaChat 2.0 умеет общаться на разных языках, лучше понимает сложные термины, качественнее распознает устную речь и акцент, а также посторонние звуки и музыку.

Теперь достаточно загрузить ссылки на нужные материалы — и GigaChat извлечет важную информацию. Модель создает краткие обзоры по материалам сайтов, сравнивает статьи на одну тему, одновременно работает с несколькими ссылками и распознает картинки с сайтов.

GigaChat 2.0 способен также обрабатывать видео по ссылке. За счет понимания аудиодорожки модель может рассказать основную суть видеоэссе или ответить на вопросы по лекции (работает также с английским и другими языками).

Функция генерации музыки и песен по текстовому запросу с помощью GigaChat вышла на новый уровень. Теперь максимальная длительность трека достигает трех минут, при этом генерация занимает столько же времени (около минуты). Повысилось соответствие конечной генерации запросу, качество звука, улучшена генерация песен на китайском языке.

Модель может проанализировать и извлечь из картинки больше полезной информации и дает более точные ответы по ее содержанию. Например, может посоветовать, какой стиль одежды выбрать для конкретного случая, поможет решить уравнение из учебника или расшифровать медицинские анализы.

Впервые в России умные колонки полностью переведены на большую языковую модель, благодаря чему их интеллектуальные возможности вышли на принципиально новый уровень. GigaChat ведет живой диалог с пользователем на понятном ему языке или в заданной роли, удерживая нить беседы до 10 раз дольше. Искусственный интеллект теперь управляет не только диалогом, но и прикладными навыками, такими как музыка или напоминания. Несколько команд можно задавать сразу в одном обращении – колонка переключится между ними самостоятельно. Взаимодействие с ассистентом теперь подстраивается под пожелания пользователя – доступно 18 комбинаций настройки, включая стиль общения, голос ассистента, обращение на «ты» или на «вы».

Вам также могут понравиться