Сервер «Тринити» с GPU Tesla для построения нейросетей
Компания «Тринити», системный интегратор и производитель ИТ-оборудования, представила разработанный ею высокопроизводительный сервер для обучения нейросетей на базе двухпроцессорного двухюнитового сервера «Тринити» с использованием трех GPU TESLA T4.
Нейросети сегодня используются для решения задач видеоаналитики, обработки медиаданных, криптографии, 3D-моделирования и анимации, научных исследований – все эти системы обучаются на больших объемах данных. Для этого нужна высокая плотность размещения вычислительных ресурсов, что диктует особые требования к конструкции, питанию и охлаждению серверов. Для российских компаний также важно, чтобы оборудование отвечало требованиям импортонезависимости.
Для решения подобных задач инженеры «Тринити» разработали специализированную версию сервера «Тринити» ER220R, включенного в реестр российской промышленной продукции Минпромторга.
Как поясняют в компании, при установке нескольких GPU в стандартный сервер наблюдается перегрев и всей машины, и особенно самих графических ускорителей. Компоненты сервера имеют встроенную термозащиту, но при длительных максимальных нагрузках снижаются частоты процессоров и GPU (троттлинг), что снижает экономическую эффективность внедрения комплекса (требуется больше серверов для обеспечения стабильной производительности). Кроме того, некоторые популярные GPU при установке нескольких штук в одну машину потребовали внесения изменений в настройки микрокода материнской платы.
В рамках проекта крупной аналитической системы для одного из заказчиков инженеры «Тринити» оперативно разработали и изготовили решение, обеспечивающее эффективное охлаждение нескольких GPU. Был предложен вариант дополнительного охлаждения, а именно термокожухи на видеокарты и охладительный элемент к каждой. Как заявляют в «Тринити», модификация позволяет эксплуатировать сервер под любой нагрузкой в течение неограниченного времени, при этом все компоненты работают на своих максимальных частотах и с большим запасом по температуре, что обеспечивает стабильную производительность, надежность и длительный срок эксплуатации комплекса.