Мультимодальная модель MWS AI для построения ИИ-агентов
Компания MWS AI (входит в МТС Web Services) объявила о выпуске Cotype Light 3 – мультимодальной языковой модели, предназначенной для встраивания в ИИ-агентов для бизнеса. Как утверждают в компании, модель одинаково точно работает с текстом и визуальными данными в едином контексте: договоры, технические чертежи, формы, изображения. Это позволяет ИИ-агентам и мультиагентным системам обрабатывать разнородные корпоративные материалы без переключения между специализированными системами и самостоятельно решать многоэтапные задачи, освобождая сотрудников от необходимости писать сложные инструкции а на каждом этапе.
Cotype Light 3 содержит 9 млрд параметров. Модели такого размера на специализированных задачах сопоставимы с более крупными аналогами, но требуют значительно меньше ресурсов: работают на стандартном корпоративном оборудовании и быстрее обучаются под конкретную задачу. Это означает меньше инфраструктурных затрат, возможность быстрого тестирования гипотез и сокращение пути от пилота до рабочей системы.
Модель на 9 млрд параметров в стандартной точности (FP16/BF16) занимает около 18 Гбайт видеопамяти. Это позволяет запускать инференс на одном серверном ускорителе, без многокарточных конфигураций и специализированных кластеров. Для развертывания подходит стандартное серверное оборудование с одним GPU: NVIDIA A100 (40 или 80 Гбайт), A10 (24 Гбайт), L4 (24 Гбайт) или аналогами. В ходе тестирования MWS AI также подтвердила полную технологическую совместимость моделей семейства Cotype со всеми компонентами отечественных программно-аппаратного комплексов, включая ПАК Скала^р Машина ИИ (продукт Группы Rubytech). Cotype Light 3 и другие модели обучатся на облачных мощностях MWS Cloud.
Как комментируют в MWS AI, финансовый эффект от внедрения ИИ становится главным критерием для бизнеса, а стоимость инференса – одна из ключевых статей в экономике любого ИИ-проекта. Компактная специализированная модель здесь имеет двойное преимущество: она дешевле в эксплуатации и точнее работает в конкретном домене, чем универсальная система с избыточным числом параметров. Cotype Light 3 создавалась именно с учетом этой логики, что позволяет ей конкурировать с моделями значительно большего размера при принципиально иных затратах.
Следующие версии семейства получат увеличенное число параметров для высоконагруженных сценариев; приоритет при разработке сохраняется за задачами, актуальными для корпоративных развертываний. MWS AI планирует расширять линейку в течение года по мере завершения тестирования новых моделей в ключевых отраслевых сценариях.