Дообучение нейросетей для бизнеса в Yandex B2B Tech
Yandex B2B Tech предоставила клиентам новую возможность дообучения нейросетей методом LoRA (Low-Rank Adaptation). Теперь компании смогут самостоятельно адаптировать нейросети под специализированные задачи: например, обучить модель писать письма в корпоративном стиле или извлекать важные данные из документов. Использование дообученной модели будет не дороже базовых версий нейросетей. Новый метод уже доступен всем клиентам на платформе для разработки ИИ-решений Yandex Cloud AI Studio.
Для дообучения методом LoRA доступны нейросеть YandexGPT и опенсорсная модель LLaMA. Вскоре это станет возможно и для моделей, которые можно запустить по запросу на выделенных мощностях, например, Qwen и DeepSeek. Таким образом бизнес сможет использовать в своих решениях несколько дообученных нейросетей, переключаться между ними и комбинировать их для разных сценариев.
Дообучение модели позволяет повысить качество решения конкретных задач: после кастомизации нейросети лучше суммаризируют и точнее классифицируют тексты, точнее следуют заданному формату ответа и придерживаются определенной роли в диалоге. Качество ответов по этим задачам даже на облегченных моделях может быть выше, чем у мощных версий нейросетей. Дообучение особенно полезно, когда требования к ответу трудно сформулировать в коротком и понятном промте.
LoRА работает быстро за счет того, что изменяет небольшое количество параметров при дообучении модели. Алгоритм ориентируется на эталонные запросы и ответы, заранее заданные пользователем, и приближает результаты работы модели к образцам из датасета. При обработке небольших датасетов весь процесс дообучения с помощью LoRA может занять всего 10 минут. Как отмечают в «Яндексе», алгоритм LoRA уже признан одним из наиболее эффективных способов дообучения, и он широко используется для кастомизации моделей среди ML-разработчиков.
Дообучение моделей, считают в «Яндексе», особенно актуально для среднего и крупного бизнеса для оптимизации наиболее частотных бизнес-задач, которые решаются с помощью нейросетей. В рамках технического тестирования LoRA уже попробовали более 100 клиентов: они использовали ее для разработки Telegram-ботов для ритейла, классификации запросов в поддержку, генерации рекламного контента и других задач.