Byte/RE ИТ-издание

Обновленная модель Kandinsky от Сбера

Сбер представил обновленную модель Kandinsky 6.0 Image для создания и редактирования изображений в ИИ-помощнике «ГигаЧат». Это бесплатный ИИ-инструмент редактирования профессионального уровня, без ограничений по количеству генераций. Флагманская модель работает быстрее, лучше понимает сложные запросы и создает более детализированные изображения. Появились новые возможности редактирования: реставрация снимков, стилизация под актуальные визуальные тренды, нейрофотосессии, смена одежды и локации, ретушь и макияж. Kandinsky стал значительно лучше разбираться в актуальных темах благодаря встроенному поиску по изображениям.

В ряде задач по качеству редактирования изображений, по данным внутренних замеров, Kandinsky конкурирует с ведущими мировыми моделями –Nano-Banana, Flux и Qwen. Все новые возможности уже доступны в ИИ-помощнике ГигаЧат – в веб-версии, мобильном приложении и мессенджерах.

Редактирование изображений стало профессиональным: одним текстовым запросом можно добавить объект в кадр или убрать лишнее, наложить фильтр или совместить элементы из разных изображений. Среди новых инструментов –реставрация старых и поврежденных снимков, в котором модель возвращает четкость выцветшим и поцарапанным фотографиям. Стилизация превращает фото в иллюстрацию в стиле аниме, комикса или мультфильма. Режим нейрофотосессии позволяет сгенерировать серию новых кадров на основе одной фотографии – с другим фоном, одеждой или локацией.

Kandinsky 6.0 точнее понимает сложные многосоставные инструкции и аккуратнее делает точечные правки: если попросить поменять персонажу прическу или добавить очки, все остальное остается нетронутым. Вырос уровень детализации в сложных сценах – интерьерах, сервировке стола, изображениях с большим числом людей. Ошибок и «галлюцинаций» стало меньше, текст на изображениях генерируется корректнее.

Модель стала лучше разбираться в актуальных темах благодаря встроенному механизму поиска по изображениям (Image RAG). Если она не знает, как выглядит объект из запроса, например новый поп-персонаж, то ищет нужный референс. Так можно генерировать точные изображения даже тех персонажей и объектов, которые появились уже после обучения модели.

Обновленный ИИ-помощник подходит для следующих задач:

  • быстрого редактирования фотографий – убрать лишнее из кадра, освежить старый снимок, примерить новый образ;
  • создания профессионального контента – визуала для соцсетей, стилизации под нужную эстетику, иллюстраций с постоянными персонажами;
  • дизайна и маркетинга – рекламных макетов, подбора фонов и композиций, визуализации идей без сложных программ;
  • строительства и недвижимости – вариантов планировки, визуализации отделки и дизайна интерьера;
  • электронной коммерции – создание карточек товаров, продуктовых сцен и рекламных изображений без фотостудии.

Сгенерированные изображения можно сразу использовать для создания видео – в ИИ-помощнике доступна модель Kandinsky Video для анимации статичного контента.

В основе Kandinsky 6.0 Image – новая архитектура Mixture of Experts (MoE), которая стала стандартом для передовых нейросетей. Ее суть в специализации: вместо того чтобы задействовать всю модель на каждый запрос, система автоматически выбирает нужных «экспертов» – отдельные блоки внутри нее. Это похоже на работу команды узких специалистов вместо одного универсала: каждый делает свое дело быстро и точно. В результате, отме6чают в Сбере, модель работает быстрее и экономнее, ее проще улучшать и дорабатывать.

Вам также могут понравиться