Облачная ML-платформа Selectel
Компания Selectel, российский провайдер IT-инфраструктуры, представила ML-платформу — облачное решение с преднастроенными аппаратными и программными компонентами, предназначенное для обучения и развертывания ML-моделей.
Платформа разворачивается индивидуально для каждого клиента и может включать в себя популярные open-source инструменты ClearML или Kubeflow, которые позволяют организовать полный цикл обучения и тестирования ML-моделей. С точки зрения инфраструктуры решение развернуто на базе сервиса Managed Kubernetes с GPU, датасеты и результаты экспериментов хранятся в объектном хранилище S3, а образы – в Container Registry. В новом решении Selectel используются видеокарты NVIDIA с большим объемом памяти – T4, A2, A30, A100, A2000, A5000.
Платформа позволяет заказчикам упростить процесс обучения и тестирования ML-моделей, а также ускорить вывод на рынок своих решений. Это возможно за счет делегирования провайдеру задач организации инфраструктуры. Кроме того, использование платформы позволяет клиентам сократить затраты на обучение ML-моделей за счет разделения одной GPU между разными задачами и платы только за потребленные ресурсы. Решение поможет пользователям стандартизировать и унифицировать рабочие процессы благодаря единой инфраструктуре, точке входа в платформу, хранилищу артефактов, а также инструментам управления экспериментами.
Как отмечают в Selectel, новая платформа тестировалась в течение года – целью компании было учесть обратную связь от пользователей и вывести на рынок решение, которое позволит клиентам меньше думать об инфраструктурных вопросах и сконцентрироваться на бизнес-задачах.