SiFive демонстрирует крошечное, похожее на Cortex-A72 ядро ​​RISC-V

SiFive представила основанный на RISC-V IP-процессор серии «U8», который примерно эквивалентен Arm Cortex-A72.
Энергоэффективные U64 с частотой до 2,6 ГГц и U87 более высокого класса предлагают суперскалярный конвейер неупорядоченного порядка и поддерживают гетерогенные конструкции SoC.

Лидер рынка RISC-V SiFive объявил о базовом IP-адресе серии U8 на основе архитектуры RISC-V с открытым исходным кодом, который, по его утверждению, является «высочайшей на сегодняшний день базовым IP-интерфейсом на основе RISC-V ISA». Конструкция IP отличается суперскалярным внешним конвейера порядка (OoO) с настраиваемой глубиной конвейера и шириной очереди выдачи.
Серия U8 предназначена для приложений, «чувствительных к производительности и задержкам», в автомобильной среде, в центрах обработки данных и в SoC с глубоким обучением на конечных или конечных точках.

SiFive также анонсировала технологию SiFive Shield для своих процессоров RISC-V, которая похожа на ArmZ TrustZone (см. Ниже).

SiFive предлагает «ведущий доступ» к IP для начального ядра U84, оптимизированного для энергоэффективности и эффективности использования площади.
За ним последует ядро ​​SiFive U87, которое добавляет поддержку векторной обработки.
По словам SiFive, стандартное ядро ​​U84 обеспечивает вдвое более высокую эффективность использования площади и в 1,5 раза лучшую производительность на ватт по сравнению с Arm Cortex-A72.


Тесты SiFive, показывающие производительность U84 по сравнению с U74 и U54

(щелкните изображение, чтобы увеличить)

По словам SiFive, первоначальная конструкция U84 обеспечивает в 3,1 раза более высокую производительность, чем стандартное ядро ​​SiFive с одноядерным U74 .
«Популярный» U74 был анонсирован год назад вместе с четырехъядерным дизайном U74-MC, оба из которых обеспечивают 2,5 ядра DMIPS, подобные Cortex A55.

Утверждается, что U84 предлагает в 5,4 раза более высокую производительность, чем исходное ядро U54 в тестах «изолированного процесса».
При изготовлении с использованием 7-нм технологии U84 работает в 7,2 раза быстрее, чем стандартное ядро ​​U54, изготовленное за 28 нм. Отчасти ядро ​​U54, похожее на Cortex-A35, является частью четырехъядерного 1,5 ГГц Freedom U540 SoC, установленного на плате разработки HiFive Unleashed .
SiFive не упоминает о поддержке ОС, но это предположительно ориентированный на Linux процессор, такой как ядра U54 и U74.


HiFive Unleashed

Неясно, учитывает ли претензия SiFive самый быстрый из доступных на сегодняшний день IP-RISC-V 16-ядерный процессор XuanTie 910 (XT 910) на базе RISC-V от Alibaba, у которого заявленный показатель CoreMark составляет 7,1 / МГц по сравнению с 5,1 / МГц для U74.
Но если повышение производительности в 3,1 раза по сравнению с U74 является точным, то, похоже, претензия будет оправдана.

По словам SiFive, увеличение производительности серии U8 обеспечивается за счет увеличения IPC в 2,3 раза (количество команд на цикл) в сочетании с увеличением максимальной частоты в 1,4 раза по сравнению с U74.

Серия U8 поддерживает множество различных производственных процессов, во главе с 7-нм технологическим процессом, который приводит к крошечной площади.
Гипотетический четырехъядерный процессор SiFive U84 с 2 МБ кэш-памяти второго уровня потребует всего 2,63 мм2 (квадратные миллиметры) для обеспечения тактовой частоты до 2,6 ГГц, утверждает SiFive.
Одно ядро ​​процессора SiFive серии U8 без кэш-памяти второго уровня может быть размещено всего за 0,28 мм2.

Стандартное ядро ​​U84 сконфигурировано с 12-ступенчатым конвейером и возможностью тройного выпуска.
Однако клиенты могут настраивать параметры внутри всей гиперплоскости пространства проектирования «Не в порядке».
Например, клиент может изменить глубину конвейера, количество очередей и другие параметры.
Как ядра U84, так и недокументированные в настоящее время ядра U87 «полностью параметризованы, что позволяет создавать широкий спектр конфигураций, что позволяет заказчикам исследовать пространство проектирования и точно настраивать производительность и функции для требуемой рабочей нагрузки», - говорит SiFive.

Другие параметры настройки включают в себя возможность «перекрестного выпуска из целочисленной единицы в единицу с плавающей запятой (FP), когда очередь FP пуста». В сочетании с «расчетной масштабируемостью числа очередей выдачи» и единицами FP в дизайн, эта возможность может привести к значительному увеличению производительности », - говорит SiFive.
Core IP серии U8 также имеет составные кеши, позволяющие процессору быть настроенным на поддержку работы в реальном времени для обеспечения детерминированного поведения с низкой задержкой.

SiFive Mix + Match

Серия U8 поддерживает гетерогенные комплексы ядер для разработки SoC, состоящих из ядер разных классов.
Эта возможность SiFive Mix + Match может, например, поддерживать гипотетический восьмиъядерный SoC, показанный на блок-схеме ниже, с комбинацией ядер серии U8 и более низкой мощности серии U7, а также MCU серии S2.


Блок-схема для гипотетического SoC на основе U84, который включает ядра U74 и S2 с использованием SiFive Mix + Match

(щелкните изображение, чтобы увеличить)

SiFive Mix + Match аналогична схеме многоядерной конфигурации Arm Big.Little, включая расширения DynamIQ .
Недавно Intel продемонстрировала свой первый гетерогенный дизайн с 10-нм процессором Lakefield SoC, в котором используется технология 3D-стекирования под названием Foveros для объединения ядра, подобного ядру Sunny Cove, с ядрами Tremont класса 4x Atom.

SiFive также предоставляет функцию пользовательских расширений инструкций, которая позволяет загружать любое ядро ​​с новыми инструкциями для облегчения ускорения рабочей нагрузки.
Arm недавно анонсировала несколько похожее расширение Custom Instructions для своих микроконтроллеров Cortex-M.
Однако SiFive, похоже, идет еще дальше, позволяя включать в IP Custom Custom Accelerator от третьих лиц «согласованное включение» с последовательной структурой SiFive TileLink для обмена данными между ядрами или согласованной структурой SiFive ChipLink для обмена данными между микросхемами.

Наконец, серия U8 предоставляет IP-интерфейс с памятью с высокой пропускной способностью, который поддерживает SiFive TileLink и отраслевые стандартные протоколы для SoC или чипсетов.
Интерфейс поддерживает интенсивную работу с памятью, для которой требуется новейшая технология памяти Samsung HBM2E + .
«В настоящее время SiFive проводит валидацию 7-нм и 12-нм техпроцессов, расширяя возможности высокопроизводительных DRAM от существующих 16-нм процессов до передовых технологий», - говорится в сообщении компании.

SiFive Shield

SiFive отдельно анонсировала технологию безопасности SiFive Shield для своих процессоров RISC-V, которая чем-то напоминает ArmZ TrustZone.
Ключевым компонентом является SiFive WorldGuard, который описывается как «точная модель безопасности для выполнения изолированного кода и защиты данных».


SiFive Worldguard работает над одноядерными (слева) и многоядерными процессорами

(нажмите на картинку, чтобы увеличить)

SiFive Worldguard предлагает «Управление информацией на уровне SoC с расширенным контролем изоляции, основанным на нескольких уровнях привилегий на мир и неограниченном количестве миров», - говорит SiFive.
Он также предоставляет режимы, управляемые ядром и идентификатором процесса, для многодоменной безопасности для защиты ядра, кэша, межсоединений, периферийных устройств и памяти.

SiFive Shield также состоит из корня доверия, предотвращения угроз и проверенных криптодвигателей.
Последние включают в себя генератор истинных случайных чисел (TRNG), совместимый с NIST SP 800-90A / B / C, для обеспечения криптографической или энтропийной защиты.
Поддержка ОС включает Linux и FreeRTOS, что предполагает, что она охватывает как свои процессоры приложений U5 / U7 / U8, так и микроконтроллеры, такие как серии E3 и S5.

Дальнейшая информация

SiFive U84 Core IP теперь доступен для «ведущего доступа», за которым последует U87.
Больше информации можно найти в анонсе SiFive серии U8 .
Больше о технологии SiFive Shield можно найти в объявлении SiFive Shield .