Высокоскоростной интерфейс в графических процессорах NVIDIA
Компания NVIDIA объявила о намерении интегрировать высокоскоростной интерфейс NVLink в будущие графические процессоры, что должно ускорить передачу данных между GPU и CPU в 5–12 раз. Тем самым новый интерфейс откроет путь к следующему поколению экзафлопсных суперкомпьютеров, в 50–100 раз более быстрее, чем самые мощные сегодняшние системы.
NVIDIA добавит технологию NVLink в свою новую графическую архитектуру Pascal, которая придет на смену архитектуре Maxwell, ее выпуск запланирован на 2016 г. Новый интерфейс был разработан совместно с компанией IBM, которая включит его в будущие версии своих процессоров POWER.
Технология NVLink улучшает передачу данных между CPU и GPU и сокращает время ожидания окончания обработки данных для графического процессора. За счет быстрого обмена данными между CPU и GPU улучшается пропускная способность вычислительной системы. С появлением NVLink разработчикам будет легче модифицировать высокопроизводительные приложения и программы анализа данных под ускоренные системы на базе CPU и GPU.
Как отмечают в IBM, эта технология вносит весомый вклад в экосистему OpenPOWER. Благодаря NVLink, связывающей CPU IBM POWER и GPU NVIDIA Tesla, можно будет максимально использовать потенциал GPU для различных приложений, таких как высокопроизводительные вычисления, анализ данных и машинное обучение.
Сегодняшние GPU связаны с x86 CPU интерфейсом PCI Express (PCIe), который ограничивает для GPU возможности доступа к памяти CPU и работает в 4–5 раз медленнее стандартной памяти CPU. Еще большей проблемой PCIe становится в системах на базе GPU и CPU IBM POWER, где полоса пропускания еще шире по сравнению с процессорами x86. Так как интерфейс NVLink будет соответствовать полосе пропускания стандартных систем памяти CPU, он предоставит графическим процессорам полноценный доступ к памяти CPU.
Новый интерфейс кардинально улучшит работу ускоряемых приложений. Из-за разницы в системах памяти (у GPU быстрая память малого объема, у CPU – большая, но медленная) ускоряемые приложения обычно пересылают данные с сети или накопителя в память CPU и затем копируют их в память GPU до их обработки графическим процессором. NVLink позволяет быстрее пересылать данные между памятью CPU и памятью GPU, значительно ускоряя работу GPU-ускоряемых приложений.
Ускоренная передача данных вместе с еще одной технологией, известной как унифицированная память (Unified Memory), упростит программирование графических процессоров. Унифицированная память позволяет разработчикам обращаться с памятью CPU и памятью GPU как с единым блоком памяти.
Хотя поддержка PCIe сохранится в будущих GPU NVIDIA, технология NVLink будет применяться для соединения GPU с CPU, поддерживаемыми NVLink, а также для высокоскоростного соединения нескольких GPU. Кроме того, несмотря на высокую пропускную способность, NVLink значительно экономичнее PCIe в расчете на пересылаемый бит.
NVIDIA представила модуль, демонстрирующий размещение графических процессоров на базе архитектуры Pascal с интерфейсом NVLink. Новый модуль GPU составляет 1/3 от стандартных плат с интерфейсом PCIe, которые используются сегодня для GPU. Расположенные на нижней стороне модуля Pascal разъемы позволяют подключать его к системной плате, улучшая в целом конструкцию системы и целостность сигнала.