Новый модуль Nvidia Jetson TX2 работает под управлением Linux на Tegra Parker

[Обновлено: 8 марта] - Jvidon TX2 COM от Nvidia использует Linux4Tegra на шестигранном ядре Tegra Parker SoC с графикой Pascal, предлагая вдвое большую производительность и / или эффективность TX1.

Nvidia анонсировала свой компьютерный модуль Nvidia Jetson третьего поколения с заявлением о том, что он предлагает удвоенную производительность в режиме высокой мощности или удвоенную энергоэффективность в режиме низкой мощности по сравнению с предыдущей моделью Jetson TX1 на базе Tegra X1.
Модуль Jetson TX2, управляемый Linux4Tegra, доступен 14 марта как часть комплекта для разработчиков за 599 долларов (299 долларов для образовательных учреждений) и будет выпущен во втором квартале по цене 399 долларов.
Nvidia также анонсировала новую версию 3.0 своего пакета JetPack SDK для Linux для своих Jetson COM.


Jetson TX2 с (слева) и без термотрансферной пластины

(нажмите на картинку, чтобы увеличить)

В объявлении Nvidia отказались назвать высокопроизводительную SoC Jetson TX2, которая добавляет усовершенствованную 256-ядерную графику Pascal и два высокопроизводительных ядра «Denver 2» в дополнение к четырем ядрам Cortex-A57, установленным на Tegra X1 Jetson TX1.
Тем не менее, пост в блоге Nvidia отмечает SoC как Tegra Parker, который Nvidia показала в августе прошлого года (см. Ниже).

По словам Nvidia, модуль Jetson TX2 совместим с TX1 с возможностью подключения и предназначен для таких приложений, как интеллектуальные заводские роботы, коммерческие дроны и интеллектуальные камеры для городов с искусственным интеллектом.
Как и Jetson TX1, Jetson TX2 имеет размеры 87 x 55 мм и обменивается данными через 400-контактный разъем с платой разработки Jetson, как подробно описано ниже.


Сравнение спецификаций модулей Jetson TX1 и TX2

(нажмите на картинку, чтобы увеличить; источник: Nvidia)

Как и TX1, TX2 предлагает контроллер GbE, а также 802.11ac WiFi и безымянную версию Bluetooth.
Другие постоянные функции включают поддержку интерфейсов USB 3.0, micro-USB 2.0, SDIO, SATA, UART, SPI, I2C, I2S и GPIO.

Память и мультимедийные функции получили самые большие обновления.
Теперь вы получаете 8 ГБ 128-битной памяти LPDDR4 со скоростью 58,3 ГБ / с, или примерно вдвое больше емкости и пропускной способности TX1.
Также имеется 32 ГБ eMMC 5.1, что вдвое больше емкости TX1.

Модуль продолжает предлагать интерфейсы дисплея, включая DisplayPort 1.2, eDP 1.4 и HDMI, но последний был обновлен до HDMI 2.0.
Теперь модуль предлагает кодирование видео с частотой 4K x 2K 60 Гц, а не 30 Гц.
Декодирование видео такое же, как 4K x 2K 60 Гц, но теперь оно поддерживает 12-битное видео вместо только 10-битного.

В ориентированных на ИИ приложениях «логический вывод на грани» эти итоги можно разделить.
Например, вы можете одновременно декодировать два потока 4K 30 Гц или выполнять анализ в реальном времени потоков HD 4x 30 кадров в секунду, помимо других возможностей.

Jetson TX2 продолжает поддерживать до 6x камер через два 12-полосных интерфейса MIPI-CSI2, и теперь он обеспечивает пропускную способность 2,5 Гбит / с на линию, а не 1,5 Гбит / с.
В дополнение к интерфейсам PCIe Gen 2 x4 и x1 теперь можно выбрать двойной x1 с конфигурацией single x2.
В отличие от TX1, TX2 предоставляет контроллер шины с двойной шиной CAN для автомобильной, промышленной или робототехнической промышленности.
Контроллер «позволяет интегрировать автопилот для управления роботами и дронами, которые используют DNN, чтобы воспринимать окружающий мир и безопасно работать в динамичных средах», - говорится в блоге Nvidia.

Модуль TX2 может работать при температуре от -25 до 80 ° C и обеспечивает входную мощность 5,5-19,6 В постоянного тока.
В предварительном брифинге Nvidia Jetson TX2, на котором присутствовали HardLinux, Дипу Талла, вице-президент и генеральный директор подразделения Tegra от Nvidia, сказал, что Jetson TX2 будет поддерживать режимы низкой и высокой мощности.

Режим Max-Q с низким энергопотреблением максимизирует энергоэффективность и работает менее чем на 7,5 Вт, или вдвое эффективнее, чем TX1.
Режим Max-Q обеспечит создание более крупных и глубоких нейронных сетей на периферийных устройствах с «более интеллектуальными устройствами с более высокой точностью и меньшим временем отклика для таких задач, как классификация изображений, навигация и распознавание речи», - говорит Нвидия.


Тесты Nvidia, показывающие, что Jetson TX2 (<15 Вт) побеждает Xeon-E5-2960 (200 Вт) при обработке логического вывода (слева) и конвейерной архитектуре TX2 AI

(нажмите на картинку, чтобы увеличить)

Мощный режим Max-P работает с мощностью менее 15 Вт и обеспечивает вдвое большую производительность, чем TX1.
Талла добавил, что SoC TX2 потребляет 3,5 Вт.
По сути, TX1 работает на 10 Вт.

В блоге Nvidia гораздо больше подробностей о двух режимах.
В нем также описываются тесты, демонстрирующие работу Jetson TX2 в режиме Max-P с мощностью менее 15 Вт, превосходящую систему мощностью 200 Вт, на которой установлен процессор Intel Xeon E5-2690 v4 SoC.
Тест измеряет пропускную способность глубокого обучения (количество изображений в секунду) с использованием сети глубокого распознавания изображений GoogLeNet.

Тегра Паркер

Согласно отчету AnandTech после августовских откровений Nvidia о Tegra Parker, SoC - та же таинственная SoC, которая использовалась в платформе Nvidia Drive PX 2 для автомобилей с самостоятельным вождением, которую Nvidia анонсировала на CES в январе 2016 года. Согласно Википедии , Tegra Parker также упоминается как Tegra P1.


Блок-схема Nvidia Tegra Parker

(щелкните изображение, чтобы увеличить)

Tegra Parker - это суперскалярный SoC шириной 7, изготовленный с использованием 16-нм процесса FinFET, по сравнению с 20-нм процессором Tegra X1, говорят AnandTech и другие источники.
В SoC реализованы два пользовательских ядра ARMv8 Denver 2, разработанные по сравнению с предыдущей версией Denver четырехъядерного SoC Tetex K1 Cortex-A15, который предлагал 64-разрядную архитектуру по сравнению с основной 32-разрядной версией K1.
Tegra K1 использовался на первом поколении Jetson TK1 , который был SBC, а не COM.

Nvidia еще не раскрыла много деталей о ядрах Denver 2, за исключением того факта, что, подобно четырем ядрам SoC Cortex-A57, каждое из них имеет 2 МБ кэш-памяти второго уровня.
Тем не менее, учитывая общие требования по повышению скорости, сделанные для Jetson TX2, ядра Denver 2, вероятно, ближе к производительности Cortex-A72 или Cortex-A73, чем Cortex-A57.

По мнению AnandTech, самые большие улучшения Denver 2 связаны с повышением энергоэффективности, а не производительностью.
Обратите внимание, что четыре ядра Cortex-A53, найденные на Tegra X1, предназначенные для маломощного распределения нагрузки Big.Little, здесь отсутствуют.
Согласно AnandTech, они не видели особого смысла в X1.
Nvidia называет новую технологию Big + Super полной неоднородной мультипроцессорной обработки (HMP) от Tegra Parker «Big + Super» с двумя «большими» ядрами -A57, работающими с двумя «супер» ядрами Denver 2.

Почта AnandTech также отметила, что Tegra Parker улучшает функциональность ввода-вывода, уделяя основное внимание автомобильной периферии, такой как CAN, и дополнительным камерам.
Также было сказано, что Паркер удвоил пропускную способность памяти до 128-битной шины памяти, увеличив общую пропускную способность до 50 ГБ / с, что должно поддерживать LPDDR4-3200.
Блок-схема, показанная выше, которая была размещена в блоге Nvidia, показывает несколько микроконтроллеров Cortex-R5, управляющих такими вещами, как управление питанием, а также процессор APE Cortex-A9 для аудио.

В предварительном обзоре Jetson TX2 Талла из Nvidia предположил, что значительные улучшения в производительности Jetson TX2 связаны с переходом с Maxwell на графику Pascal.
Паскаль, который распространен в настольных видеокартах, имеет то же количество 256 ядер CUDA, что и Maxwell.
AnandTech, однако, предполагает, что переход от Максвелла к Паскалю не такой революционный, как предыдущий переход с Кеплера на Максвелла.
Тем не менее, в Pascal есть значительные улучшения в таких областях, как «детальное переключение контекста для приложений CUDA».

Комплект разработчика Jetson TX2 и пакет JetPack 3.0 SDK

Изначально Jetson TX2 поставляется в составе комплекта разработчика Jetson TX2 форм-фактора Mini-ITX 170 x 170 мм, который, по-видимому, тесно связан с платой TX1.
В комплект разработчика входят порты GbE, USB 3.0, micro-USB 2.0 и HDMI береговой линии, а также интерфейсы SATA, M.2 Key E и PCIe x4.
Там есть полноразмерный слот для SD, а также дисплей и разъемы расширения камеры MIPI-CSI.


Держатель комплекта разработчика Jetson TX2 (слева) и полный комплект

(нажмите на картинку, чтобы увеличить)

Заголовки также предусмотрены для GPIO, I2C, I2S, SPI, CAN и TTL UART с контролем потока.
Плата дополнительно оснащена WiFi-антеннами и внешним адаптером переменного тока 19В.

В прошлом году Connect Tech поставила две меньшие несущие платы для TX1: Orbitty и Elroy , а в блоге Nvidia говорится, что Connect Tech и Auvidea предоставят меньшие несущие платы, которые поддерживают как TX2, так и TX1.
Другими партнерами по экосистеме являются Leopard Imaging и Ridge Run, которые обеспечат поддержку камер и мультимедиа.
Abaco Systems и Wolf Advanced Technology будут поставлять системы MIL-spec на основе TX2 для работы в жестких условиях.

Jetson TX2 определяется как «открытая платформа», но поддержка открытого аппаратного обеспечения со схемами, по-видимому, предлагается только для несущей платы.
Запись в блоге Nvidia указывает на различные ресурсы для разработчиков как для модуля, так и для платы.

Комплект разработчика поставляется с обновленным, ориентированным на AI, пакетом JetPack 3.0 SDK, созданным на основе Linux4Tegra, пользовательской версии Ubuntu на основе Linux 4.4.
SDK предоставляет механизм помех нейронной сети TensorRT 1.0 для производственного развертывания приложений глубокого обучения, которые, как сообщается в блоге Nvidia, сыграли важную роль в предполагаемой победе TX2 над Xeon.
Он также включает в себя ускоренную на GPU библиотеку cuDNN 5.1 примитивов для глубоких нейронных сетей, созданную на основе CUDA 8.


JetPack 3.0 SDK архитектура

(щелкните изображение, чтобы увеличить)

JetPack 3.0 дополнительно поставляется с VisionWorks 1.6 SDK для компьютерного зрения и обработки изображений.
Обновленные графические драйверы и API включают OpenGL 4.5, OpenGL ES 3.2, EGL 1.4 и Vulkan 1.0.
Nvidia опубликовала на GitHub набор примеров для глубокого изучения «Два дня до демонстрации».

Дальнейшая информация

Комплект разработчика Nvidia Jetson TX2, в комплекте с модулем Jetson TX2, можно предварительно заказать сегодня за 599 долларов в США и Европе, и его доставка начнется 14 марта. Он будет доступен в других регионах в ближайшие недели.
Модуль Jetson TX2 будет доступен во втором квартале за 399 долларов США в количестве 1000 штук или более от Nvidia и ее глобальных дистрибьюторов.
Набор разработчика Jetson TX1 по-прежнему доступен, его стоимость составляет 499 долларов.
Более подробная информация доступна на странице Nvidia Jetson TX2 .
Примечание: Комплект разработчика Jetson TX2 доступен для образовательных учреждений за 299 долларов.