Аналитики теперь выделяют ИИ-ориентированные ЦОДы в особую категорию дата-центров – ИИ-фабрики, новый тип тяжелой промышленной инфраструктуры, единственная цель которой – генерация машинных ответов на задаваемые живыми операторами вопросы. Эксперты Omdia наметили пять направлений, по которым этот сегмент рынка будет активно развиваться в нынешнем году.
О том, насколько для современной экономики значимы связанные с искусственным интеллектом вычисления (тренировка и исполнение генеративных моделей), говорит следующий прогноз Omdia: к 2030 г. совокупные глобальные инвестиции в ЦОДы на планете приблизятся к 1,6 трлн долл.; только вливания в ИТ-инфраструктуру для решения ИИ-задач в мире превысят 600 млрд долл. Аналитики выделяют теперь ИИ-ориентированные ЦОДы в особую категорию дата-центров – ИИ-фабрики, поскольку такие предприятия – в полном смысле cлова промышленного масштаба – характеризуются (в отличие от классических ЦОДов) сверхвысокой капиталоемкостью, значительной подверженностью геополитическим факторам (имеются в виду прежде всего торговые барьеры) и высокой инженерной сложностью реализации проектов.
Иными словами, ИИ-фабрика – это новый тип тяжелой промышленной инфраструктуры, единственная цель которой – генерация машинных ответов на задаваемые живыми операторами (либо другими машинами, в случае агентного ИИ) вопросы. Характерный признак промышленного производства – отчуждаемость, типизация выпускаемой продукции; грубо говоря, сталелитейную промышленность (с учетом различия в локальных марках стали) разных стран потому и можно сопоставлять и изучать статистически, что она изготавливает определенные объемы биржевого товара – продукта строго фиксированных характеристик, что как раз допускает его отчуждение и организованную торговлю им без привязки к месту производства.
В случае ИИ-фабрик таким биржевым товаром выступают токены: на них разбиваются получаемые ИИ-моделями подсказки, из них же обратным преобразованием модели формируют ответы в виде текста, статичных изображений, видео и т. д. Плата с клиентов также взимается исходя из количества сгенерированных в ходе вычислений токенов – поскольку объем ресурсов (прежде всего электроэнергии и воды), затрачиваемых на порождение одного токена, для данного ЦОДа достаточно стабильная величина и не зависит от того, какую именно задачу решает в данный момент исполняемая на его серверах ИИ-модель.
Аналитики не просто так вводят в оборот новое определение ориентированного на ИИ-задачи ЦОДа именно как ИИ-фабрики. Проведя опрос, охвативший более 200 компаний, Omdia выяснила, что рынок, на котором оперируют эти фабрики – поставщики токенов, страдает от четырех основных проблем, а именно: от длительного time-to-market и слабости критериев, на основании которого оценивается рентабельность инвестиций; от фактора цифрового суверенитета (высокоплатежеспособным китайским заказчикам, к примеру, по политическим мотивам отрезан доступ к особо мощным американским ИИ-фабрикам); от нехватки квалифицированных кадров в области ИИ и, наконец, от сложности системного проектирования: одна только проблема многократно более высокой (в сравнении с классическими ЦОДами) теплогенерации серверных стоек с ИИ-ускорителями требует неординарных инженерных решений.
Проанализировав текущую ситуацию в новорожденном сегменте ИИ-фабрик, в Omdia наметили пять направлений, по которым этот сегмент будет наиболее активно развиваться именно в нынешнем году.
1. Забитые дорогими ускорителями ИИ-фабрики уже страдают от эффекта «зомби-GPU» – вынужденного простоя таких ускорителей в ожидании поступления новой задачи. Соответственно, оценивать работоспособность ИИ-фабрик нужно не в привычных терминах потенциальной вычислительной мощи (floating-point operations per second, FLOPS), а в продолжительности задержки от получения запроса до генерации в ответ на него первого токена (time to first token, TTFT). Это позволит и ресурсы внутри фабрики использовать полнее, и для заказчиков снизить стоимость токена, делая сервис более привлекательным.
2. Соблюдать суверенное законодательство необходимо, но и в этих рамках ИИ-фабрики могут проявлять гибкость. Так, полностью интегрированная парадигма предоставления услуг подразумевает исполнение ИИ-модели уровня публичного облака в виде интегрированного физического блока в пределах клиентского ЦОДа – что блокирует возможные утечки чувствительных данных, не лишая заказчика доступа к самым крупным современным моделям.
3. Модернизация облачных вычислений на основе ИИ: плотность энергопотребления стоек выросла с 10–15 кВт в 2024 г. до 40–250 кВт в 2026-м. Это заставляет коммерческие ЦОДы менять бизнес-модель с аренды оборудования (bare metal) на модель MaaS (Model-as-a-Service) – ради высокоэффективного контроля над вычислительными ресурсами и энергопотреблением.
4. «Последняя миля» индустриализации ИИ: участники ИТ-канала зарабатывают на долгосрочном управлении данными клиентов, интеграции устаревших систем и сборках агентов для конкретных сценариев заказчика, а операторы ИИ-фабрик – на интенсивной эксплуатации своей инфраструктуры под гарантированно высокими (как раз за счет высокой плотности собираемых интеграторами от заказчиков заявок) нагрузками.
5. Рост суверенных фабрик данных, отвечающих нормативно-правовым рамкам государств (США, КНР) и их союзов (ЕС).
В итоге, подчеркивают в Omdia, уже совсем скоро – быть может, даже к исходу текущего года, – конкуренция на уровне ИИ-фабрик станет определяться не параметрами развернутых в них моделей и не количеством графических процессоров, а всеобъемлющим противостоянием сразу по нескольким направлениям: достаточность объемов энерго- и водоснабжения, эффективность теплоотвода, наличие необходимых чипов и автономных программных стеков, соответствие регуляторным требованиям – и даже долгосрочная устойчивость капитала, которым располагает оператор той или иной фабрики. Аналитики ожидают, что 2026–2027 гг. окажутся критически важны для развития ИИ-фабрик – причем региональные и отраслевые предприятия такого рода с наибольшей вероятностью будут уверенно наращивать объемы выручки в течение следующих пяти лет.