GPU оптимальны для работы нейросети. Однако, эксперты ожидают, что довольно скоро дискретные ГП общего назначения (GPGPU) уступят первенство в локальном исполнении ИИ-моделей более специализированным нейропроцессорам (NPU).
Появление интегрированных графических процессоров оказало в свое время существенное влияние на мировой рынок дискретных видеокарт: выяснилось, что для подавляющего большинства повседневных задач возможностей встроенного в центральный процессор скромного ГП вполне достаточно. Обособленные видеокарты на долгие годы сделались предметом интереса достаточно нишевых категорий пользователей ПК – геймеров, энтузиастов, мастеров цифровых визуальных искусств (дизайнеров, видеоредакторов, 3D-моделлеров и пр.) Смартфоны, разработчики которых всегда предпочитали единую интегрированную систему-на-кристалле множеству разрозненных чипов, также почти полностью полагаются на встроенные графические адаптеры.
Всплеск массового интереса к генеративному искусственному интеллекту осенью 2023 г., спровоцированный открытием доступа к «умному» боту ChatGPT, не утих до сих пор – и в значительной мере способствовал уверенному росту спроса на дискретную компьютерную графику. Причина проста: работа нейросети, лежащей в основе генеративной модели, сводится к взвешенному (т. е. с домножением слагаемых на определенные весовые коэффициенты) суммированию многих миллиардов чисел. (Скалярное умножение векторов и матриц).
Такого рода операции великолепно распараллеливаются, и потому чем больше в системе несложных вычислительных ядер, способных вести одновременное взвешенное суммирование, и чем обширнее доступный объем оперативной памяти для хранения промежуточных результатов таких расчетов, тем быстрее исполняются на компьютерном «железе» ИИ-модели. Дискретные графические адаптеры с их сотнями сравнительно простых (если сравнивать с теми, что входят в состав современных ЦП) вычислительных ядер и многими гигабайтами, а то и десятками гигабайт видеопамяти наилучшим образом подходят для решения такого рода задач.
Точнее – наилучшим из доступных на данный момент: как указывают эксперты DIGITIMES Research, уже в довольно скором времени дискретные ГП общего назначения (general-purpose graphics processing units, GPGPU) уступят первенство в локальном исполнении ИИ-моделей более специализированным нейропроцессорам (neural processing unit, NPU).
Последние могут быть реализованы и в виде обособленных карт расширения, но по причине сравнительной конструктивной простоты отлично подходят для интеграции с ЦП на едином кристалле, на манер нынешних встроенных ГП. Поскольку вычислительные ядра GPGPU все-таки обладают избыточной мощностью для одного только взвешенного суммирования, а генеративным моделям ничего сверх этого по сути не требуется, множество разработчиков комплектующих для персональных систем принимаются концентрировать усилия на создании как встроенных, так и дискретных NPU для перспективных ИИ-ПК и ИИ-смартфонов.
Нейропроцессоры при сопоставимой с GPGPU производительности на типичных ИИ-задачах вследствие своей упрощенной архитектуры будут демонстрировать ощутимо более низкое энергопотребление – и при этом отличаться заметно меньшей себестоимостью. Это открывает обширные возможности не только для локальных ИИ-вычислений, но и для запуска генеративных моделей на периферии частной ИТ-инфраструктуры (edge computing), обеспечивая тем самым преимущества для заказчиков, по тем или иным причинам не готовых предоставлять свои чувствительные данные доступным в публичных облаках (как сервисы) ИИ-моделям. Децентрализация генеративной нагрузки будет способствовать сокращению интернет-трафика, снижению энергопотребления гиперскейлерскими ЦОДами, высвобождению их ресурсов для решения вычислительно более сложных задач, востребованных клиентами.
Вместе с тем аналитики DIGITIMES Research отмечают потенциальные минусы бурного развития NPU-направления высокотехнологичного рынка – прежде всего высокую специализацию таких систем, что в перспективе может сделать их непригодными для исполнения грядущих, более совершенных ИИ-моделей, если те будут опираться на усложненные вычислительные схемы. Для индустриальных ИИ-приложений (машинное зрение, промышленные роботы и пр.) NPU, исходно разрабатываемые с расчетом на вполне определенные проприетарные модели, почти наверняка станут отраслевым стандартом. Однако если поставщики ПК и смартфонов желают привлечь внимание покупателей гаджетами с нейропроцессорами, способными демонстрировать сравнимую с GPGPU-системами производительность, но значительно более бюджетными и энергоэффективными, им придется поспособствовать развитию широко распространенных открытых стандартов построения генеративных ИИ-моделей. Или, по крайней мере, тесно сотрудничать с разработчиками наиболее популярных ИИ-систем с закрытым кодом – так, чтобы гарантировать их исполнение на включаемых в состав новых вычислительных систем NPU на много лет вперед.