Глава Nvidia – о будущем ИИ
Выступая на конференции SIGGRAPH 2024, CEO Nvidia Дженсен Хуанг сделал ряд весьма категоричных заявлений о том, как искусственный интеллект изменит бизнес, экономику и жизнь в целом уже в самое ближайшее время. Однако на фоне скептицизма инвесторов в отношении ИИ эти предположения могут и не реализоваться.
В ходе недавней конференции SIGGRAPH 2024 в Денвере (шт. Колорадо, США) глава Nvidia Дженсен Хуанг (Jensen Huang, Хуан Жэньсюнь) сделал целый ряд довольно категоричных заявлений о том, как искусственный интеллект (генеративный прежде всего) изменит бизнес, экономику и жизнь в целом уже в самое ближайшее время. На фоне нарастающего скептицизма инвесторов в отношении ИИ, а также затруднений самой Nvidia с выпуском новейших серверных ускорителей Blackwell, оптимизированных как раз для работы с генеративными моделями, эти пророчества могут, впрочем, и не реализоваться в намеченные сроки, – однако актуальный вектор развития ИИ-технологий они демонстрируют вполне наглядно.
Итак, что же именно считает «крайне вероятным» (very likely) в обозримой перспективе CEO компании – разработчика наиболее востребованных на рынке аппаратных средства для ИИ-расчетов?
• Умные помощники на основе генеративных моделей либо заменят людей по некоторым направлениям деятельности целиком, либо существенно преобразуют характер выполняемой теми работы – в частности, помогая программистам писать код, программным инженерам – обнаруживать в нем ошибки и потенциальные уязвимости, разработчикам чипов – создавать эффективные инженерные дизайны новых процессоров и т. д.
• Вместе с тем и сам генеративный ИИ должен будет меняться, поскольку невозможно полностью полагаться на компьютерного помощника, «галлюцинирующего» на том уровне, который свойственен нынешним генеративным моделям. Для этого создатели таких систем больше внимания станут уделять технике обучения новых моделей с подкреплением через обратную связь с человеком-экспертом (что замедлит процесс по сравнению с чисто машинным самообучением на предложенном массиве данных, но, по идее, повысит качество ответов готовой модели), а также глубокой оптимизации как самих обучающих массивов, так и алгоритмов затребования из них данных в процессе тренировки.
• Будет происходить еще более заметный, чем в последние пару лет, сдвиг парадигмы программирования от универсальности (когда все алгоритмы строятся с расчетом на единую вычислительную архитектуру, по сути однопоточную, и рост производительности обеспечивается лишь увеличением скорости работы ЦП) к специализации на отдельных категориях задач – примерно так, как для генеративного ИИ оказались оптимальными графические процессоры с их множеством слабеньких по абсолютной производительности вычислительных ядер.
• Придется найти способ снизить энергопотребление ИИ-вычислений, поскольку если экстраполировать нынешние аппетиты генеративных моделей по затратам электроэнергии на перспективу ближайших лет, затраты на содержание дата-центров окажутся несуразно большими. В частности, одним из выходов Дженсен Хуанг видит переход от поиска информации в облаках к ее генерации ИИ-моделями непосредственно по запросу on-premises, что должно избавить провайдеров от необходимость хранить на своих серверах гигантские массивы когда-то созданных данных (программного кода, картинок, видео и т. п.) в ожидании того, пока к ним кто-то обратится.
• Другой логичный путь снижения бремени энергозатрат на ИИ – возведение дата-центров для него в местностях с избытком электрогенерации, что заодно обеспечит экономию на аренде/покупке земли и сопутствующих расходах по сравнению с постройкой новых ЦОДов в привычных центрах ИТ-жизни, таких как Кремниевая долина.
• «Ускоренные вычисления» (accelerated computing; имеется в виду ускорение за счет распараллеливания задач на множество потоков, обеспечиваемое как раз графическими ускорителями в связке с соответствующим ПО) постепенно продолжат вытеснять классические одно- или малопоточные, напрямую зависящие от производительности центрального процессора с небольшим числом сверхмощных ядер. Это также должно приводить к сокращению потребления энергии – поскольку скромные по производительности ядра графических процессоров весьма экономны (каждое по отдельности), и если удастся эффективно распараллеливать сложные задачи на большое, но конечное число одновременно исполняемых потоков – с чем также может и должен помочь ИИ, – это теоретически поспособствует снижению глобальных энергетических затрат на ИТ в целом.
* * *
Заявления, надо сказать, действительно категоричные – особенно в части того, будто ускоренные вычисления заведомо энергоэффективнее однопоточных, а генерировать информацию локально, по запросу, с привлечением ИИ-моделей разумнее, чем хранить ее, однажды созданную и верифицированную, в дата-центрах. В любом случае, оправдаются ли ожидания главы Nvidia и если да, то как скоро, во многом будет зависеть от продолжительности и глубины происходящих прямо сейчас пертурбаций на фондовых рынках мира – в ходе которых акции ИТ-компаний, сделавших ставку на генеративный ИИ, подешевели в совокупности уже на сотни миллиардов долларов.