Чип Baidu и Samsung для ускорения задач ИИ
Китайский поисковик Baidu и компания Samsung Electronics объявили о создании первого ускорителя искусственного интеллекта от Baidu – процессора Kunlun, предназначенного для работы на самых разных платформах, от облака до периферии. Компании готовы запустить его в массовое производство уже в начале следующего года.
В основе чипа Baidu Kunlun лежит разработка Baidu XPU – архитектура нейронных процессоров для облачных и граничных вычислений, в его производстве используется 14-нм техпроцесс и технология пакетирования I-Cube от Samsung.
Новый процессор обеспечивает пропускную способность памяти на уровне 512 Гбайт/с и позволяет осуществлять до 260 TOPS при энергопотреблении 150 Вт. Кроме того, в чипе поддерживается предварительно обученная нейронная модель Ernie для обработки данных на естественном языке, которая выполняет построение логических выводов втрое быстрее, чем традиционная модель ускорения GPU/FPGA.
Благодаря большой вычислительной мощности и низкому энергопотреблению новый процессор позволит Baidu эффективно выполнять различные задачи, в том числе запускать масштабные рабочие нагрузки с использованием ИИ, например, ранжировать поисковые результаты, распознавать речь, изображения и естественные языки, а также разрабатывать системы автономного вождения и реализовывать платформы глубокого обучения, такие как PaddlePaddle.
В рамках пилотного сотрудничества Baidu предоставит свои ИИ-платформы для обеспечения максимальной производительности, а Samsung запустит производство на своих полупроводниковых фабриках процессоров для HPC, предназначенных для работы в облаке и на периферии.
Для достижения высокой производительности, необходимой для рабочих нагрузок ИИ или HPC-вычислений, в чипе применяется технология пакетирования (chip integration technology). Представленная Samsung технология интеграции I-Cube, соединяющая логический чип и память с высокой пропускной способностью (HBM2) с подложкой (interposer), позволяет добиться более высокой плотности и пропускной способности при минимальном размере за счет использования дифференцированных решений Samsung.
Считается, что внедрение I-Cube ознаменует начало новой эпохи на рынке гетерогенных вычислений. По сравнению с предыдущими разработками новые решения существенно увеличивают производительность процессора и обеспечивают прирост вычислительной мощности/целостности сигнала более чем на 50%. Кроме того, Samsung разрабатывает еще более совершенные технологии пакетирования, такие как технологию RDL-подложки (redistribution layers), а также интегрированные корпуса с 4x и 8x HBM памяти.