Плата Zynq UltraScale + поддерживает новую платформу Xilinx AI

Компания iWave представила набор разработчика для своего модуля iW-Rainbow G30M на базе Zynq Ultrascale + на базе Linux с поддержкой новой платформы Xilinx AI.
Xilinx внедряет технологию искусственного интеллекта в свои 7-нм процессоры Versal на базе Linux, которые скоро появятся в продаже.

Компания iWave Systems выпустила «iW-Rainbow G30D Zynq Ultrascale + MPSoC Development Kit» для своего вычислительного модуля iW-Rainbow G30M , который работает под управлением Linux на Arm Cortex-A53 / FPGA Xilinx Zynq UltraScale + MPSoC.
В анонсе набора iWave сосредоточился главным образом на способности платформы протестировать новую платформу Xilinx AI, которую она называет ядром Xilinx / Deephi.
Платформа ИИ Xilinx, которая простирается от центра до центра обработки данных, основана в основном на приобретении компанией DeePhi, специализирующейся на ИИ.


iW-Rainbow G30M

Ниже мы рассмотрим платформу ИИ Xilinx и то, как Xilinx использует некоторые из этих технологий в своих новых 7-нм двойных чипах -72 / FPGA Versal ACAP.
Xilinx продемонстрировал Versal в начале этой недели на форуме разработчиков Xilinx.

Также на этой неделе Xilinx анонсировала платформу разработки Vitis для своих ПЛИС, которая выходит за рамки этой статьи.
Основываясь на библиотеках с открытым исходным кодом, Vitis объявлен как более простая альтернатива его Vivado Design Suite.
Платформа включает в себя компонент Vitis AI, который предназначается для Versal.

iW-Rainbow G30D

Новый комплект разработчика Zynq Ultrascale + MPSoC с несущей платой iW-Rainbow G30D расширяет модуль iW-Rainbow G30M под управлением Linux 4.14.
Модуль G30M работает на четырехъядерном процессоре Zynq UltraScale + MPSoC -53 с логическими ячейками FPGA от 192 до 504K.
Модуль поставляется с 4 ГБ памяти DDR4, 1 ГБ для FPGA и 8 ГБ расширяемой eMMC.
Также имеется поддержка от -40 до 85 ° C среди других функций, подробно описанных в нашем отчете iW-Rainbow G30M за сентябрь 2018 года.


iW-Rainbow G30D и блок-схема

Несущая плата iW-Rainbow G30D 140 x 130 мм имеет 2 порта GbE и клетку SFP +.
Вы также получаете один DisplayPort, хост USB 2.0, USB Type-C и консольные порты отладки.
Внутренний ввод / вывод включает в себя SD, CAN, JTAG и 20-контактный заголовок ввода / вывода.

Два разъема FMC HPC обеспечивают входы / выходы, связанные с ПЛИС, включая LVDS, 14 высокоскоростных приемопередатчиков, двойной 12-контактный PMOD, SATA, PCIe x4 и другие.
На плате установлен RTC с держателем батареи и входом 12 В.

Xilinx AI Platform

Объявление iW-Rainbow G30D ссылается на веб-страницу для платформы Xilinx AI, которую она называет «Xilinx / Deephi Core». Платформа Xilinx AI была разработана в значительной степени на основе приобретения Xilinx DeepPhi Technology Co. в июле 2018 года. DeePhi был стартапом в Пекине с опытом в области машинного обучения, глубокого сжатия, сокращения и оптимизации на уровне системы для нейронных сетей.


Диаграммы архитектуры платформы Xilinx AI (слева) и платформы Xilinx Edge AI

Основные алгоритмы Deephi могут выполнять критические задачи в режиме реального времени непосредственно на Zynq UltraScale + FPGA, говорит iWave.
IW-Rainbow G30M поддерживает «огромный портфель ядер Deephi» для крайних приложений / приложений для искусственного интеллекта, а новый комплект разработчика теперь упрощает создание прототипов с помощью этой технологии, заявляет компания.


Baidu EdgeBoard

Zynq Ultrascale + ранее был представлен в качестве процессора AI на платформе EdgeBoard Baidu, анонсированной в январе .
Тем не менее, недавно выпущенный EdgeBoard использует собственные алгоритмы Baidu Brain AI.

Базовая технология Deephi «разреженная нейронная сеть» включает технологию сокращения Convolutional Neural Network (CNN) и алгоритм глубокого сжатия, чтобы уменьшить размер алгоритмов AI для краевых приложений.
По словам iWave, алгоритмы Deephi «вывод в режиме реального времени со сверхнизкой задержкой» поддерживают ускорение AI / ML в распознавании лиц и обнаружении изображений / поз для интеллектуального наблюдения.
Другие приложения включают в себя интуитивно понятные ADAS для автомобильной помощи, прогнозирования технического обслуживания промышленной автоматизации и интеллектуального здравоохранения для мониторинга и диагностики в режиме реального времени.


Ранняя слайд-платформа Xilinx, демонстрирующая запланированную интеграцию технологии Deephi

Как поясняется в анализе EE Journal о приобретении, DeePhi оптимизировал свои алгоритмы для Zynq 7000, прежде чем перейти к Zynq UltraScale + MPSoC.
Как показано в таблице выше для слайд-платформы Xilinx 2018 года (PDF), технология Deephi, включая обрезку, квантователь, компилятор, среду выполнения, модели и IP FPGA, стала основной частью того, что позже будет продаваться как Xilinx. Платформа AI.
Он образует почти всю ребро / встроенную сторону, которая называется Xilinx Edge AI Platform.


Архитектура DPU платформы Xilinx Edge AI (слева) и доступные модели платформы AI Xilinx

Компонент FPGA IP в платформе Xilinx Edge AI называется процессором глубокого обучения (DPU).
Аппаратный блок оптимизирован для работы с ПЛИС Xilinx для ускорения алгоритмов ИИ с низкой задержкой.

AI Platform Xilinx Edge поддерживает структуры AI, включая TensorFlow, Caffe, Darknet и другие.
Xilinx перечисляет 18 доступных моделей для распознавания, классификации, обнаружения, оценки и локализации объектов, лиц, пешеходов, ADAS, а также для их локализации (см. Диаграмму выше).

Платформа Xilinx Edge AI оснащена готовым к использованию Linux DNNDK (комплектом для разработки Deep Neural Network) для развертывания вывода AI на платформах Xilinx Edge AI с облегченным C / C ++ API.
Инструмент DNEPK DEEP ComprEssioN (DECENT) «может снизить сложность модели в 5–50 раз с минимальным воздействием на точность», - говорит Xilinx.
Также есть компилятор глубокой нейронной сети (DNNC), среда выполнения нейронной сети (N2Cube) и профилировщик.

Версия ЦОД Xilinx AI не имеет DPU, но вместо этого добавляет архитектуру XDNN (Xilinx Deep Neural Network Inference) Xilinx на самом низком уровне FPGA IP.
При поддержке соответствующего компилятора xfDNN и среды выполнения XDNN отображает ряд инфраструктур нейронных сетей на высокопроизводительную VU9P Virtex UltraScale + FPGA для центров обработки данных.

Versal ACAP

В октябре прошлого года Xilinx анонсировала новое семейство процессоров Versal ACAP (платформа с адаптивным ускорением вычислений).
Versal с гетерогенным ускорением «является первой платформой, в которой сочетаются программируемость программного обеспечения с аппаратным ускорением в конкретной области» и встроенной адаптивностью через архитектуру ACAP », - говорит Xilinx.


Xilinx Versal

Версаль, построенный с использованием 7-нм процесса FinFET по сравнению с 16-нм для Zynq UltraScale +, будет состоять из шести отдельных процессоров, два из которых начнут внедряться до конца года.
Первоначальные модели Versal Prime и Versal AI Core, которые в первую очередь предназначены для центров обработки данных и высокопроизводительных устройств с граничным AI, соответственно, начали выборку в июне .

Процессоры Versal Prime, Premium и HBM предназначены для высокопроизводительных центров обработки данных и сетевых приложений.
Серия AI Core, AI Edge и AI RF предназначена для сетевых и периферийных устройств с поддержкой AI и добавляет блок AI Engine, предназначенный для вывода AI с малой задержкой.

Похоже, что AI Engine частично основан на технологии платформы Deephi и Xilinx Edge AI.
В AI Engine используются векторные процессоры VLIW / SIMD с частотой 1,3 ГГц, которые можно развернуть в структуре листов.
Ядра взаимодействуют с полосой пропускания «терабайт / сек» с другими движками.

Как подробно описано в этом слайде Versal (PDF), все процессоры Versal оснащены двумя ядрами Cortex-A72 с частотой 1,7 ГГц, поддерживаемыми встроенной ОС Linux, и двумя ядрами Cortex-R5 с частотой 750 МГц, поддерживаемыми FreeRTOS.


Версаль блок-схема

Программируемый логический компонент упоминается не как FPGA, а как Versal Adaptable Engines.
Логика включает в себя «мелкозернистую параллельную обработку, агрегацию данных и объединение датчиков». Она также предлагает программируемую иерархию памяти с «высокой пропускной способностью, перемещением данных с малой задержкой между механизмами и вводом / выводом», говорит Xilinx.

Адаптируемые двигатели обеспечивают в 4 раза большую плотность на логический блок, предположительно по сравнению с UltraScale +.
Отдельно от программируемой логики находится блок DSP Engines с производительностью до 1 ГГц, предназначенный для ускорения беспроводной связи, машинного обучения и высокопроизводительных вычислений.
Как уже отмечалось, некоторые модели также предоставляют AI Engine.

Объединение всех этих частей воедино представляет собой сеть-на-кристалле (NoC) со скоростью несколько терабит в секунду, которая отображает в памяти доступ ко всем ресурсам для облегчения программирования.
Это также позволяет легко менять ядра и соединять разные ядра.

NOC работает с компонентом «Shell», который включает контроллер управления платформой, который предлагает функции безопасности и загрузки.
Он также включает в себя подсистему масштабируемой памяти и интерфейсы хоста и ввода / вывода.
Versal работает с новой унифицированной программной платформой Vitis и обратно совместима с Zynq UltraScale +.

Первые две версии Versal - это документированные в настоящее время Versal Prime и Versal AI Core.
AI Core с поддержкой AI Engine оснащен 256 КБ встроенной оперативной памяти с ECC и более 1,9 миллиона ячеек системной логики.
Существует также более 1900 двигателей DSP, оптимизированных для высокоточной плавающей запятой с низкой задержкой.


Архитектура Xilinx Versal (слева) и набор для тестирования Versal AI Core VCK190

Уже есть набор для тестирования Versal AI Core VCK190 на базе Linux.
AI Core нацелена на очень высококачественные системы, такие как инфраструктура 5G, автомобильная промышленность и центр обработки данных.
Однако мы предполагаем, что большинство читателей HardLinux будут более заинтересованы в грядущих - и в настоящее время недокументированных - встроенных платформах AI Edge и AI RF.

Дополнительная информация

Комплект разработчика iW-Rainbow G30D Zynq Ultrascale + MPSoC от iWave теперь доступен по неизвестной цене.
Более подробную информацию можно найти на странице продукта .
Более подробную информацию о платформе Xilinx AI можно найти здесь, а дополнительную информацию о процессорах Versal можно найти здесь .