Обновленная нейросеть Kandinsky
Сбер представил свою усовершенствованную нейросеть, создающую изображения по текстовому описанию на русском и английском языках. Версия Kandinsky 3.1 дообучена на увеличенном датасете изображений, что позволило повысить качество генераций. Первым доступ к Kandinsky 3.1 получил ограниченный круг пользователей: художники, дизайнеры, блогеры.
Одна из ключевых особенностей новой версии – более высокая скорость генерации картинок: время одной генерации сократилось почти в 10 раз, а разрешение генераций можно повысить до 4K. Появилась возможность улучшения текстового запроса с помощью языковой модели. Пользователям снова будут доступны функции создания различных вариаций изображений, смешивание картинок и текста, создание стикерпаков и возможность вносить локальные изменения на картинке, не меняя всей композиции сцены (ControlNet).
По сравнению с предыдущей моделью, комментируют в Сбере, Kandinsky 3.1 стала еще быстрее, удобнее и реалистичнее. Это гибкий, многофункциональный и бесплатный инструмент, который может превратить любого человека в художника и творца. Скоро все желающие смогут протестировать новые возможности нейросети. Как и предыдущие версии, модель будет бесплатной и доступна на разных поверхностях.
Также в ближайшее время появится новая модель Kandinsky Video 1.1 для генерации видео по текстовым описаниям. Удалось существенно повысить качество генераций за счет увеличения объема обучающего датасета пар «текст-видео» и архитектурных улучшений модели. Внесенные изменения также позволили повысить разрешение видео в два раза по сравнению с Kandinsky Video 1.0.
Модель Kandinsky разработана командой Sber AI при партнерской поддержке ученых из Института искусственного интеллекта AIRI на объединенных датасетах Sber AI и компании SberDevices.