Byte/RE ИТ-издание

Ядерные перспективы ИИ

Чтобы ИИ взаимодействовал с человеком в реальном масштабе времени, необходимы высокомощные вычислительные средства, потребляющие, в свою очередь, чрезвычайно много энергии. Возможное решение для ведущих поставщиков услуг ИИ, прежде всего облачных, – использование энергии ядерных электростанций, в том числе ядерных реакторов малой мощности, выпуск которых ожидается в 2030 г.

Любые вычисления требуют затрат энергии, но особенно это верно для тех, что связаны с задачами машинного обучения и искусственного интеллекта. С математической точки зрения задачи эти не слишком сложны и сводятся – в том числе для особенно популярного в наши дни генеративного ИИ – просто к умножению вектора на матрицу, не более. Однако размерности этих вектора и матрицы таковы, что модели, выполняющие такое умножение, нуждаются в сотнях и тысячах физических процессорных ядер (пусть и маломощных), перемещающих гигабайты данных между разными отделами высокоскоростной оперативной памяти.

Формально все это можно реализовать и на крайне скромном «железе», с непрерывной подкачкой данных из постоянной памяти, но тогда скорость обработки – тех же запросов к ChatGPT, Midjourney, Kling и пр. – окажется слишком низка: чтобы ИИ взаимодействовал с человеком в реальном масштабе  времени, необходимы высокомощные графические и/или нейроадаптеры.

А эти аппаратные средства, в свою очередь, потребляют чрезвычайно много энергии: к примеру, если стандартный запрос к поисковой системе, такой как Google, обходится ее провайдеру примерно в 0,3 Вт энергозатрат, то каждое обращение к умному чат-боту – в 3 Вт и более. Соответственно на порядок возрастает мощность, потребляемая дата-центром, если заполнять его ориентированными на работу с ИИ серверами вместо классических, менее энергоемких. Обучение же новых моделей – еще более затратная в плане расходования электроэнергии процедура, чем их эксплуатация. Вот почему ведущие поставщики услуг ИИ (прежде всего облачных) уже задумываются над включением в свою структуру ядерных электростанций – иначе в среднесрочной перспективе не выйдет гарантировать бесперебойную работу ИИ-ЦОДов, нагрузка на которые, судя по заверениям экспертов, в ближайшем будущем продолжит нарастать.

Есть уже и некоторые практические шаги. Так, AWS в 2024 г. приобрела у компании Talen Energy за 650 млн долл. ЦОД вместе со специально выделенным для его питания ядерным реактором мощностью 960 МВт из состава ядерной станции в Пенсильвании. Точнее, пока только заключен договор о покупке, – его еще должен утвердить федеральный регулятор, поскольку речь идет не просто о резервировании для дата-центра части вырабатываемой станцией энергии, но по сути о предоставлении в исключительное пользование провайдеру облачных услуг одного из реакторов на территории предприятия.

Microsoft, в свою очередь, еще в 2023 г. зарезервировала для своего ЦОДа в Бодитоне (шт. Вирджиния), значительные объемы вырабатываемой там ядерной энергии, планируя за их счет покрыть до 35% потребностей этого дата-центра. Кроме того, для аналогичных операций в Канаде был заключен договор с местным поставщиком электроэнергии Ontario Power Generation.

Аналитики уверены, что как только (ориентировочно с 2030 г.) в Северной Америке начнут серийно производиться ядерные реакторы малой мощности, одними из главных их заказчиков окажутся именно гиперскейлеры, предоставляющие услуги облачного доступа к ИИ-моделям и/или аппаратную основу для их тренировок. Дополнительный аргумент в пользу этого, помимо очевидно высокой потребности ИИ в энергии, – недостаточная пропускная способность американских ЛЭП, что затрудняет маневрирование доступными энергоресурсами и делает предпочтительным монтаж малых реакторов непосредственно у обслуживаемых ими ЦОДов.

Вам также могут понравиться