Чипы Cortex-A76, Mali-G76 и ML разрабатывают ИИ

Конструкция Arm Cortex-A76 обеспечивает повышение скорости / эффективности, включая 4-кратное повышение производительности ИИ, и в сочетании с новым графическим процессором Mali-G76, который, как говорят, также помогает ИИ.
В то же время Arm раскрыл больше подробностей о своих будущих сопроцессорах ML.

Очень немногие несерверные системы используют программное обеспечение, которое можно назвать машинным обучением (ML) и искусственным интеллектом (AI).
Тем не менее, приложения «ИИ на краю» серверного класса выходят на встраиваемые устройства, и Arm намерена бороться с Intel и AMD за каждое из них.


Сравнение производительности Cortex-A76

(щелкните изображение, чтобы увеличить)

(Источник: Арм)

Arm недавно анонсировала новую архитектуру Cortex-A76, которая, как утверждается, ускорит обработку алгоритмов AI и ML на периферийных вычислительных устройствах в четыре раза.
Это не включает в себя повышение производительности ML, обещанное новым графическим процессором Mali-G76.
Есть также Malu-V76 VPU, разработанный для видео высокого разрешения.
Cortex-A76 и две конструкции Mali предназначены для «дополнения» процессоров Arm Trillium с машинным обучением Project (см. Ниже).

Cortex-A76 строится на новой архитектуре

Cortex-A76 отличается от IP-решений Cortex-A73 и Cortex-A75 тем, что он предназначен как для ноутбуков, так и для смартфонов и встроенных устройств высокого класса.
Cortex-A76 обеспечивает «на 35 процентов больше производительности по сравнению с прошлым годом» по сравнению с Cortex-A75, утверждает Arm.
IP, который, как ожидается, появится в продуктах через год, также, как говорят, обеспечит повышение эффективности на 40 процентов.

Как Cortex-A75, который эквивалентен последним ядрам Kyro, доступным на Snapdragon 845 компании Qualcomm, Cortex-A76 поддерживает DynamIQ , более гибкую версию Arm своей многоядерной схемы Big.Little.
В отличие от Cortex-A75, который был анонсирован с сопутствующим чипом Cortex-A55, у Arm не было нового DynamIQ-компаньона для Cortex-A76.
Однако приведенная ниже диаграмма предполагает, что он также предназначен для работы с Cortex-A55 в гетерогенных конструкциях.


Cortex-A76 с Cortex-A55 в Dynamiq настроен гетерогенным SoC

(щелкните изображение, чтобы увеличить)

(Источник: Арм)

Говорят, что усовершенствования Cortex-A76 включают в себя прогнозирование ветвлений и выбор команд, а также первое 4-ядерное ядро ​​декодирования Arm, которое повышает максимальные возможности команд за цикл.
Также имеется более высокая пропускная способность для целочисленных и векторных операций, включая поддержку собственных 16-битных (128-битных) векторных модулей и модулей с плавающей запятой.
Наконец, новая иерархия памяти с полным кешем «оптимизирована для обеспечения задержки и пропускной способности», - говорит Арм.

В отличие от последних высококлассных версий Cortex-A, Cortex-A76 представляет «совершенно новую микроархитектуру», говорит Арм.
Это подтверждается обычным глубоким анализом AnandTech .
Cortex-A73 и -A75 дебютировали элементы новой архитектуры «Артемида», но Cortex-A76 построен с нуля с Artemis.

По словам AnandTech, Cortex-A76 должен поставляться с 7-нм продуктами TSMC, работающими на частоте 3GHz.
4-кратное улучшение рабочих нагрузок ML связано, прежде всего, с новыми оптимизациями в конвейерах ASIMD «и тем, как обрабатываются точечные продукты», - говорится в статье.

Между тем, The Register отметила, что Cortex-A76 является первым проектом Arm, который будет работать исключительно на 64-битном коде уровня ядра.
Ядро будет поддерживать 32-битный код, но только на непривилегированных уровнях.

Мали-G76 GPU и Мали-G72 VPU

Новый графический процессор Mali-G76, анонсированный с Cortex-A76, предназначен для игр, VR, AR и ML на устройстве.
Говорят, что Mali-G76 обеспечивает на 30% больше эффективности и плотности, а производительность мобильных игр - в 1,5 раза.
Архитектура GPU Bifrost также обеспечивает повышение производительности ML в 2,7 раза по сравнению с Mali-G72, который был анонсирован в прошлом году с Cortex-A75.

Mali-V76 VPU поддерживает просмотр UHD 8K.
Он нацелен на видеостены 4 × 4, которые особенно популярны в Китае, и предназначен для поддержки 8K видеопокрытия, которое Япония обещает для Олимпийских игр 2020 года.
Потоки 8K @ 60 требуют в четыре раза большей пропускной способности, чем потоки 4K @ 60.
Чтобы достичь этого, Arm добавил дополнительную шину AXI и удвоил линейные буферы по всему видео конвейеру.
VPU также поддерживает декодирование 8K @ 30.

Подробная информация о чипе ML проекта Trillium

Ранее Арм раскрыл другие подробности о процессоре машинного обучения (ML), также называемом MLP.
Микросхема ML ускорит AI-приложения, включая машинный перевод и распознавание лиц.

Новая архитектура процессора является частью инициативы Project Trillium для ИИ и следует за процессором обнаружения объектов второго поколения от Arm для оптимизации визуальной обработки и обнаружения людей / объектов.
Дизайн ML будет впервые представлен в качестве сопроцессора в мобильных телефонах к концу 2019 года.


ML архитектура

(щелкните изображение, чтобы увеличить)

(Источник: Arm через AnandTech)

Многочисленные блок-схемы для MLP были опубликованы AnandTech , который был проинформирован о дизайне.
Утверждая, что любое суждение о производительности еще не законченного ML IP потребует выпуска кремния в следующем году, публикация говорит, что чип ML, кажется, проверяет все требования ускорителя нейронной сети, включая обеспечение эффективных сверточных вычислений и перемещения данных, пока также обеспечивает достаточную программируемость.

Арм утверждает, что чипы будут обеспечивать производительность> 3 ТОП на ватт в 7-нм проектах с абсолютной пропускной способностью 4,6 ТОП, получая целевую мощность приблизительно 1,5 Вт.
Для обеспечения программируемости MLP будет изначально ориентирован на API-интерфейс Neural Networks для Android и Arm NN SDK .

Эта статья защищена авторским правом © 2018 Linux.com и была первоначально опубликована здесь .
Он был воспроизведен этим сайтом с разрешения его владельца.
Пожалуйста, посетите Linux.com для получения последних новостей и статей о Linux и open source.