9 月 20 日,Synopsys 宣布扩展其 DesignWare® ARC® 处理器 IP 产品组合,推出针对低功耗嵌入式 SoC 的新型 128 位 ARC VPX2 和 256 位 ARC VPX3 DSP 处理器。 2019 年,该公司推出了用于高性能信号处理 SoC 的 512 位 ARC VPX5 DSP 处理器。
Synopsys 处理器解决方案高级营销总监 Matt Gutierrez、ARC VPX DSP 处理器高级产品营销经理 Markus Willems等介绍了新款ARC处理器。
坚定不移地专注于嵌入式应用
从 1990 年代至今, ARC始终专注于支持嵌入式应用程序。从历史上看,ARC 处理器并未针对过移动应用。但是随着嵌入式应用市场的发展,ARC 处理器技术也相应地发生了变化。 ARC 处理器已经从仅用于简单和专用的任务(例如电源管理)发展到甚至可以运行 64 位 Linux 操作系统。
2010 年成为 Synopsys 的一部分后,蓬勃发展的物联网市场推动了构建新一代嵌入式 ARC 处理器。需要一个非常小的、高效的、低功耗的处理器系列来支持物联网市场。一种新的架构和 ISA 诞生了。早期的物联网设备需要最少量的 DSP 功能,处理器中添加了一些 DSP 功能就可以支持 IoT 要求。
快进到今天,Synopsys 提供五个不同的 ARC 产品系列,每个系列都有广泛的阵容。嵌入式处理器的每个产品系列都满足了广泛应用且严格的要求。VPX2和VPX3DSP主要用于语音处理、雷达/激光雷达、传感器融合和高端物联网应用。
专注推动高效的 ARC 架构
指令集架构 (ISA) 的设计考虑了嵌入式市场。例如,比较与控制传输和分支与循环等独特的指令可以轻松高效地实现常见的嵌入式程序行为。另一个例子是为32 位指令执行16 位编码。ARC ISA 有许多这样的特性来减少代码大小,因为嵌入式设备的内存空间非常宝贵。
每个微架构决策也都考虑到嵌入式市场。例如,内置影子寄存器对于实时嵌入式应用程序非常重要,可以实现快速上下文切换。这些类型的架构决策对嵌入式应用程序有很大的影响。可以轻松将为某些其他应用程序设计的处理器进行调整,以支持嵌入式应用。
ARC 价值主张的其他重要方面是设计的可配置性和指令集的可扩展性。可配置性使得仅实现 SoC 所需的最低硬件即可。可扩展性允许添加自定义指令以加速应用程序代码、增加代码密度并降低功耗。
客户能够有效地创建由单一标准 MetaWare 工具链支持的定制处理器硬件,为他们的应用程序需求提供最佳 PPA 和代码密度。大多数 ARC 客户可以通过为其特定算法添加自定义指令来扩展指令集。
应对不断扩大的市场需求
在推出 VPX 系列处理器之前,ARC 处理器可以归类为大 CPU、小 DSP IP 解决方案。物联网传感器融合、雷达和 LiDAR 处理、语音/语音识别和自然语言处理等嵌入式工作负载需要成熟的 DSP 功能。由于 Synopsys 看到了这种不断增长的市场需求,他们推出了 VPX 系列处理器,它使用扩展的 ARC ISA 来实现高度矢量化的 DSP。
推动 PPA 优化信号处理的关键应用
这些市场的产品要求
浮点支持对于信号处理应用变得越来越重要。为这些市场开发的数据处理算法使用浮点来支持宽动态范围。保持浮点而不是转换为定点可以更快地将算法映射到设计架构。支持这些应用的 DSP 库和线性代数库以浮点格式表示。与过去相比,对矢量浮点运算编程的强大支持正变得越来越重要。
人工智能算法的高效执行是另一个必备条件现代 DSP。这意味着支持短整数数据类型,如 Int8,结合专用编程环境,允许图形平滑映射到 DSP 架构。当然,DSP 必须配备丰富的机器学习内核库,针对硬件进行优化,以简化软件开发。
用于线性和非线性代数运算的专用硬件加速器显着加快了这些越来越多使用的数学函数的速度。
随着产品公司开始提供多种变体,可配置性、可扩展性和可缩放性正成为关键要求。每个变体可以针对 PPA 和代码密度进行不同的优化。
VPX 系列 DSP IP
凭借代表 7 种不同 DSP 的三种不同 VPX 系列的可用性,客户现在可以更灵活地实现特定应用要求。最新的两款产品基于与两年前推出的更高性能 512 位 ARC VPX5 DSP 处理器相同的 VLIW/SIMD 架构。由于新增产品针对的是低功耗嵌入式 SoC,因此它们设计用于更小的矢量长度,从而实现更小、更低的功耗。由于超高浮点性能是 VPX DSP 的重点,因此提供了矢量浮点单元 (VFPU) 作为选项。 VFPU 由多个流水线实现,每个时钟周期能够执行多达 512 个 FLOP。随着这两款新产品的推出,Synopsys 还宣布了对 VPX5 处理器的一些增强。
ARC VPX2 和 VPX3 DSP IP
产品的轻松迁移和可扩展性
Synopsys ARC MetaWare 开发工具包支持 ARC VPX 处理器,该工具包提供矢量长度不可知 (VLA) 软件编程模型。从编程的角度来看,向量长度被标识为“n”,n 的值在定义语句中指定。 MetaWare 编译器执行映射并选择正确的软件库集进行编译。编译器还提供自动矢量化功能,可将顺序代码转换为矢量操作,以实现最大吞吐量。
结合 DSP、机器学习和线性代数函数软件库,MetaWare 开发工具包提供了一个全面的编程环境。
总之,上述功能使客户能够轻松地在 VPX 系列的所有成员之间迁移和/或扩展他们的产品。
优化当前基于 ARC VPX5 的设计的机会
可扩展的 ARC VPX 系列一览
VPX5 增强功能包括双宽矢量加载/存储、更宽的 AXI 接口、ISA 扩展以及支持基于 VLA 的编程模型的机器学习、DSP 和线性代数库。这些增强功能使 VPX5在常见 DSP 功能(如 FFT、点积和窗口化)方面的性能与早期版本相比提高了一倍。在许多应用中,设计人员无需为这些功能实现设计单独的外部加速器。
对于汽车市场
为了满足汽车市场更高的安全要求,Synopsys 为其整个产品组合提供了功能安全 (FS) 系列,包括 VPX 系列处理器。 FS 系列处理器满足随机故障检测和系统功能安全开发流程要求,完全符合 ISO 26262 至 ASIL D。
概括
提供设计效率、优化 PPA 和最大化软件代码密度是 ARC 的根本所在。 Synopsys 的 ARC VPX DSP 系列处理器为客户提供全方位的可扩展解决方案,以满足他们不同的需求。