Byte/RE ИТ-издание

Evolution AI Factory от Cloud.ru – в коммерческой эксплуатации

Провайдер Cloud.ru объявил на конференции AI Journey, что запустил в коммерческую эксплуатацию Cloud.ru Evolution AI Factory – среду для внедрения решений на основе генеративных нейросетей. Теперь сервисы предоставляются на основе доступных тарифов, с гарантированным уровнем сервиса (SLA), круглосуточной поддержкой и возможностью масштабирования нагрузки.

AI Factory состоит из шести взаимосвязанных сервисов, необходимых для полного цикла работы с ИИ. Сервис AI Agents предоставляет возможности запуска агентов, отвечающих за самостоятельное выполнение задач, принятие решений и взаимодействие с другими системами в проектах пользователя. Пользователям AI Factory также доступен каталог открытых больших языковых моделей (LLM) Foundation Models, в который входит более 20 популярных моделей, в том числе российская GigaChat и модели open source из других линеек. Доступ к моделям реализован через OpenAI API. Сервис ML Inference позволяет быстро развернуть модели из каталога Hugging Face, а также собственные модели. Для работы и экспериментов с машинным обучением, запуска и тестирования ML-гипотез есть сервис Evolution Notebooks на базе JupyterLab. Дообучение моделей под специальные задачи бизнеса происходит в сервисе ML Finetuning. За использование только собственных данных пользователя для повышения точности ответа моделей отвечает сервис Managed RAG.

С ноября на открытые LLM из каталога Foundation Models действуют выгодные цены. Средняя цена на популярные модели составляет 35 руб. за входной и 70 руб. за выходной миллион токенов.

Кроме того, недавно Cloud.ru открыл бесплатный доступ к новой флагманской языковой модели из семейства GigaChat 3.0 – GigaChat Lightning, она стала доступна всем зарегистрированным пользователям Cloud.ru в каталоге Evolution Foundation Models.

GigaChat Lightning (10B-A1.8B) получила название благодаря скорости инференса и стала самой компактной и быстрой моделью в линейке. Она оптимизирована для локального запуска на ноутбуке и поддержки быстрых продуктовых итераций. Модель превосходит Qwen3-4B в русскоязычных задачах и не уступает ей в диалоге, анализе документов и решении прикладных бизнес-задач. Скорость GigaChat Lightning в 1,5 раза выше Qwen3-4B и сравнима с моделью Qwen3-1.7B.

Подключение GigaChat Lightning через Evolution Foundation Models возможно по OpenAI-совместимому API. Сейчас модель находится на стадии тестирования, доступ к ней останется бесплатным до его завершения. Вся информация, обрабатываемая GigaChat Lightning, хранится на территории России и обрабатывается в соответствии с требованиями законодательства.

Вам также могут понравиться