Вышла версия NVIDIA CUDA 4.0
Компания NVIDIA выпустила новую версию набора инструментов CUDA для разработки параллельных приложений с помощью своих графических процессоров. Набор NVIDIA CUDA 4.0 предназначен для того, чтобы упростить параллельное программирование и позволить еще более широкому кругу разработчиков портировать свои приложения на GPU.
Основные возможности новой архитектуры:
- Технология NVIDIA GPUDirect 2.0 обеспечивает равноправную связь между GPU в рамках одного сервера или рабочей станции, что упрощает и ускоряет мультипроцессорноеи-GPU программирование и работу приложений.
- Унифицированная виртуальная адресация (UVA) организует единое адресное пространство для основной системной памяти и памяти GPU, что делает параллельное программирование быстрее и проще.
- Библиотеки примитивов Thrust C++ – набор алгоритмов C++ с открытым кодомв для параллельных расчетов и структур данных – упрощают программирование для разработчиков на C++. Thrust ускоряет стандартные операции, такие как параллельное хранение, в 5–100 раз по сравнению с библиотеками Standard Template Library (STL) и Threading Building Blocks (TBB).
Архитектура CUDA 4.0 включает и другие функции и возможности:
- MPI интеграция с приложениями CUDA – модификация MPI, такая как OpenMPI, автоматически пересылает данные из памяти GPU и в память по Infiniband, когда приложение посылает или получает запрос с MPI.
- Многопоточность и GPU – многочисленные потоки с CPU хоста могут обмениваться контекстом на одном GPU, что упрощает совместное использование GPU многопоточными приложениями.
- Использование нескольких GPU одним потоком с CPU – один поток с CPU хоста может иметь доступ ко всем GPU в системе. Разработчики могут легко распределить работу между несколькими GPU для таких задач, как обмен «ореолами» в приложениях.
- Новая библиотека NPP для обработки изображений и компьютерного видения – большой набор операций трансформации изображения, которые позволяют быстро разрабатывать приложения обработки изображений и компьютерного зрения.
Версия CUDA Toolkit 4.0 доступна бесплатно с 4 марта при условии вступления в программу разработчиков CUDA: www.nvidia.com/paralleldeveloper.