Byte/RE ИТ-издание

Аренда GPU нового поколения в K2 Cloud

Компания K2 Cloud (подразделение «К2Тех») объявила, что ее клиентам стали доступны в аренду новые типы графических ускорителей (GPU): NVIDIA Tesla H100 80 Гбайт и L40s 48 Гбайт. Также под заказ им могут быть предоставлены NVIDIA H200 Tensor Core GPU 141 Гбайт. На сегодняшний день эти типы видеокарт имеются у ограниченного количества компаний на рынке.

GPU as a Service (GPUaaS) доступен как в формате почасовой аренды (pay as you go), так и по коммитированным контрактам на 3, 6 или 12 месяцев со скидкой до 25%. На сегодняшний день срок актуальности GPU составляет всего 1–2 года, что зачастую делает нецелесообразным закупку оборудования для собственной on premise инфраструктуры, так как оно быстро устаревает. Использование GPUaaS, по данным K2 Cloud, на 75% снижает для компаний затраты на инфраструктуру для ML-моделей и высокопроизводительных вычислений и помогает ускорять запуск новых проектов.

Модель GPUaaS применима не только для экспериментов с ML и обучения моделей, но и для работы ИИ-приложений, высокопроизводительных вычислений, работы с графикой и анимацией, 3D-моделирования. При этом под каждую из задач необходимы видеокарты разной мощности. Например, для обучения ИИ-моделей может потребоваться мощная видеокарта NVIDIA Tesla H100, но на короткий срок – от 1 дня до нескольких месяцев. После того как этот этап завершен, заказчики могут перейти на менее мощные карты для повседневного инференса. Таким образом, GPUaaS позволяет гибко управлять вычислительными ресурсами и оптимизировать расходы на инфраструктуру.

Заказчики K2 Cloud могут развернуть GPU на выделенных серверах с большим объемом CPU и RAM или в виртуальных машинах с параметрами, подобранными под конкретные запросы. Поддерживается использование до 4 видеокарт внутри одной виртуальной машины с технологией NVLink, что позволяет решать ресурсоемкие задачи: от обучения моделей генеративного ИИ и анализа больших данных до сложного моделирования.

Вам также могут понравиться