Сервис T1 Cloud на базе графических процессоров Nvidia
Провайдер T1 Cloud анонсировал расширение портфеля облачных сервисов на базе графических ускорителей GPU, предоставив клиентам доступ к видеокартам Nvidia H100. Это дает новый уровень эффективности при работе с машинным обучением и обучением нейросетей, анализе и обработки данных, высокоскоростных вычислениях и др.
По заявлению T1 Cloud, с запуском нового инфраструктурного сервиса в облаке компании смогут в 9 раз быстрее проводить обучение и до 30 раз быстрее – инференс моделей ИИ по сравнению с предыдущими поколениями видеокарт.
Облачные вычисления с GPU подходят для тренировки больших языковых моделей (LLM), моделей ИИ, которые могут генерировать текст, переводить языки, отвечать на вопросы человеческим образом и применяться для предиктивной аналитики в различных областях. Так, клиенты из сферы розничной торговли смогут более точно прогнозировать сезонный спрос и продажи, финансовые организации и банки – ускорить оценку кредитных рисков, повысить эффективность обработки транзакций в реальном времени и обеспечить их безопасность, а промышленные предприятия – оптимизировать производственные процессы. Сервис можно также использовать для разработки беспилотных автомобилей, систем медицинской диагностики и других приложений на базе ИИ.
Облачные сервисы с графическими ускорителями GPU развернуты на базе инфраструктуры T1 Cloud с учетом комплексного подхода к обеспечению безопасности и полного соответствия требованиям регулирующих органов. Аттестация провайдера в соответствии с 152-ФЗ, 187-ФЗ и ГОСТ Р 57580.1 по наивысшим уровням защиты дает возможность компаниям размещать и работать в облаке с персональными и другими чувствительными данными любой категории значимости.
На данный момент клиентам Т1 Cloud доступны виртуальные машины с графическими ускорителями GPU на базе видеокарт Nvidia A100 и H100 в конфигурациях вычислительных ресурсов от 1 до 8 карт на виртуальную машину, до 80 Гбайт памяти HBM3 и с пропускной способностью 2 Тбайт/с. В зависимости от требований проекта клиент может оперативно увеличить количество вычислительных ресурсов. Сервис предоставляется по запросу в рамках модели подписки c гарантированным уровнем SLA и круглосуточной технической поддержкой от специалистов провайдера.