Byte/RE ИТ-издание

Большая конференция NVidia: об ИИ-агентах и не только

На CES 2025 глава nVidia Дженсен Хуанг объявил о запуске нового поколения видеокарт RTX 5000 под кодовым именем Blackwell, а также, ожидаемо, представил массу передовых решений для сектора ИИ. Ведь именно переживаемый нами хайп на AI сделал NVIDIA самой дорогой компанией мира по капитализации. Так что, о каких бы решениях не шла речь, все в конечном счете сводилось к проблематике AGI.

RTX 5000

Что до RTX 5000 – флагманские RTX5090 показывают до двукратного прироста производительности в некоторых геймерских и вычислительных сценариях, в сопоставлении с предшественниками серии 4000. Карты используют до 32 ГБ видеопамяти DDR7.

Кроме чисто GPU-возможностей, естественно речь также идет об акселерации задач ИИ. В 5000-й серии реализованы вычисления c точностью 4P. NVidia громогласно заявляет о том, что настольные ПК с новыми GPU могут стать полноценными инструментами для решения задач генеративного ИИ локально, без использования облачных ресурсов.

О локальных ИИ-решениях домашнего уровне в связи с анонсом новых GPU говорилось, кажется больше, чем о видеоиграх или виртуальной реальности. Например, Nvidia показала ноутбук на базе мобильных чипов RTX 5090 ИИ-производительность которого может достигать 1850 TOPS. (В сравнении с ноутбучными решениями от Intel и AMD, это усиление сразу на три порядка. Ведь, даже последние мобильные Core i9 Arrow Lake имеют уровень TOPS для интегрированных NPU всего лишь 13 (!). Да и десктопные флагманы Intel Core по этому показателю не выходят за пределы 50 TOPS.)

Мобильные суперкомпьютеры Nvidia Digits

Следующим передовым решением Nvidia стали суперчипы Nvidia GB10, которые интегрируются в миниатюрные ИИ-суперкомпьютеры Nvidia Digits, созданные в сотрудничестве с MediaTek.

SoC-чипы Nvidia GB10 будут состоять из Blackwell GPU с производительностью 1 PFLOP в формате FP4 и центрального процессора Grace CPU с 20 ядрами. Это устройство, стоимостью $3000 будет доступно с мая 2025 г.

Автопилоты NVIDIA Thor

Как известно, Nvidia является активистом ИИ-автопилотирования в автомобильной отрасли. На CES 2025 была представлена платформа Hyperion 9 на базе процессора NVIDIA Thor. Новый чип в 20 раз превышает по мощности ИИ-процессоры для авто предыдущего поколения Orin.


NVIDIA LLama Nemotron Language Foundation

В сфере больших языковых моделей (LLM) NVidia развивает семейство LLama Nemotron набор новых языковых моделей на базе Llama от Meta, доработанных Nvidia.

Решение позволяет повысить качество и расширить функциональность базовых решений LLaMA 3.1. для имплементации RAG-функций, или оркестрации работы с другими LLM-моделями.

В упрощенной версии Nano модели Nemotron можно локально использовать даже на ПК.

«Они могут быть моделями-оценщиками, судьями, которые проверяют ответы других моделей и решают, хорош этот ответ или нет, давая обратную связь.
Их можно использовать различными способами. В основном это обучающие модели, модели для извлечения знаний.»

Концепция ИИ-агентов NVIDIA

Под ИИ-агентами понимаются узкоспециализированные ML-модели для данных определенного формата, нацеленные на решение конкретных задач. И c этими отдельными задачами справляющиеся лучше, чем общие гигантские мультимодальные инструменты, типа ChatGPT.

Различные ИИ-агенты оркеструются для взаимодействия между собой и с внешними источниками данных, для получения конечного результата.

Таким образом, автоматизируется привычный монотонный труд, задачи требующие обработки огромных объемов входных данных разных типов, как в цифровом пространстве, так и в реальной среде.

Понимания физику: NVIDIA Cosmos и Physical AI

Последним из представленных ИИ-решений от Nvidia стали платформы NVIDIA Cosmos и Physical AI. NVIDIA Cosmos — платформа обученная на 20 миллионах часов разнообразного видео, на которых запечатлен окружающий мир. Инструмент позволит лучше адаптировать искусственный интеллект к реалиям физического мира. Она будет использоваться для обучения роботов. Это может способствовать развитию таких устройств, допустим, как роботы гуманоидной конструкции, которые будут повторять механические операции, производимые в реальности людьми.

Для обобществления и понимания физических действий, используется модель Nvidia Physical AI, которая расширяет существующую концепцию трансформерных LLM за счет понимания пространственных отношений и физического поведения в трехмерном мире.

Вам также могут понравиться