作者:Kenton Williston
人工智能 (AI)、机器学习 (ML) 和其他计算密集型工作负载在物联网 (IoT) 网络边缘的兴起,给微控制器 (MCU) 带来了额外的处理负载。处理这些新的工作负载会增加功耗,尽管要求设计人员尽量降低功耗并加快产品上市时间。
设计人员需要一个计算选项,既能保持 MCU 的效率,又能增加专为低功耗应用定制的高性能功能。这一选项还应保留与传统 MCU 相关的简单部署模式,同时增加足够的功能,以支持 AI 和 ML 带来的复杂应用,如语音控制和预见性维护。
本文讨论了推动 AI 和 ML 需求的因素,解释了为什么需要新型处理器架构来高效地实现这些功能。然后介绍 Renesas 的 RA8M1 系列 MCU,并说明如何利用其来满足这些要求。
边缘 AI 和 ML 的要求
从楼宇自动化、工业设备到家用电器,边缘物联网应用对 AI 和 ML 的需求与日俱增。现在,即使是相对较小、功耗较低的嵌入式系统,也要承担关键词识别、语音命令控制和音频/图像处理等工作任务。目标应用包括传感器中枢、无人机导航和控制、增强现实 (AR)、虚拟现实 (VR) 和通信设备。
为了最大限度地减少能耗、开销和延迟,同时确保隐私,在边缘处理数据通常比将数据发送到云更可行。这对设计人员来说具有挑战性,因为边缘设备往往资源有限,特别是在采用电池供电的情况下。
用于边缘计算的增强型 MCU
AI 和 ML 工作负载通常包含在大型数据集中重复执行相同的数学运算。这些工作负载适合使用单指令、多数据 (SIMD) 处理进行加速。SIMD 可并行执行多个数学运算,与传统处理方式相比,吞吐量更多,能效更高。
由于传统 MCU 缺乏 SIMD 功能,因此无法独立执行 AI 和 ML 工作负载。一种解决方案是同时使用 MCU 和数字信号处理器 (DSP) 或其他 SIMD 加速器。然而,这种多处理器方法会使系统设计变得复杂。
另一种方法是使用具有 SIMD 功能且性能更高的微处理器单元 (MPU)。这可以在单处理器设置中提供必要的性能,但 MPU 在功耗和功能集方面需要进行权衡。例如,并非所有 MPU 都具有面向 MCU 应用所需的确定性、低延迟计算。
在 MCU 中实现 AI 和 ML
Renesas 意识到需要一套优化型 MCU 来支持 AI 和 ML 工作负载,因此推出了 RA8M1 系列 MCU(图 1)。该系列基于带有 Helium 和 TrustZone 的 Arm®Cortex®-M85 架构,其运行频率为 480 MHz,典型功耗为 225µA/MHz。
图 1:Renesas 的 RA8M1 MCU 基于 Arm Cortex-M85,包含可加速 AI 和 ML 处理功能的 Helium 技术。(图片来源:Renesas)
RA8M1 MCU 专为实现高效性能和低功耗而设计,具有确定性、中断时间短和最先进的电源管理支持等特性。该处理器的性能效率达到每兆赫 6.39 CoreMark (CoreMark/MHz)。
Helium 是一种 SIMD M-Profile 矢量扩展 (MVE),可显著加快信号处理和 ML 的速度。它增加了 150 条标量和矢量指令,可处理 128 位寄存器(图 2)。它针对资源有限、功耗较低的微控制器进行了优化。例如,Helium 重新使用浮点单元 (FPU) 寄存器,而不是引入新的 SIMD 寄存器。这有助于降低处理器功耗,减少设计复杂性。
图 2:Helium 重新利用 FPU 寄存器组进行矢量处理。(图片来源:Image source: Arm)
如图 3 所示,RA8M1 的 Cortex-M85 包含了 Arm 的 TrustZone 技术。TrustZone 为关键固件、资产和私人信息提供硬件隔离。Cortex-M85 还增加了新的安全保障功能,如指针验证和分支目标识别 (PACBTI) 扩展。在 AI 环境下,设备可能会与个人数据进行交互,因此这些安全功能尤为重要。
图 3:Cortex-M85 的 TrustZone 为关键固件、资产和私人信息提供硬件隔离。(图片来源:Image source: Arm)
具备 AI 功能的 MCU 应具备的硬件特性
MCU 应将高效性与强大的功能集相结合,以支持人工智能应用。RA8M1 可用于电机控制、可编程逻辑控制 (PLC)、计量以及其他工业和物联网应用。
例如,人工智能算法需要大量存储器。RA8M1 系统存储器包括高达 2 MB 的闪存和 1 MB 的 SRAM。SRAM 包括 128 KB 的紧耦合内存 (TCM),可实现高性能计算的快速存储访问。
为确保可靠运行,384 KB 的用户 SRAM 和整个 128 KB 的 TCM 均配置为纠错码 (ECC) 存储器。32 KB 指令和数据高速缓存也受 ECC 保护。
RA8M1 除包含 Arm 内核的功能外,还集成了多种安全功能。其中包括用于安全数据处理的可重复编程安全知识产权 (RSIP) 加密引擎、用于关键数据保护的不可变存储以及篡改保护机制。
在通信接口方面,MCU 配备了用于网络连接的以太网、用于汽车和工业应用的控制器区域网灵活数据速率 (CAN FD) 以及用于通用连接的 USB 高速/全速接口。该器件还集成了摄像头接口和八进制串行外设接口 (SPI),可为外部存储器进行即时解密。
模拟接口包括 12 位模数转换器 (ADC) 和数模转换器 (DAC)、高速模拟比较器以及三个采样和保持电路。RA8M1 支持多种串行通信协议,包括带 SPI 的串行通信接口 (SCI)、通用异步接收器/发射器 (UART) 和内部集成电路间 (I²C) 模式。该 MCU 还提供改进型内部集成电路 (I3C),以提高数据传输速率和效率。
对于需要全面访问这些输入/输出 (I/O) 功能的开发人员,可使用像 224 引脚 R7FA8M1AHECBD#UC0 这样的球栅阵列 (BGA) 封装。那些希望印刷电路板(PC 板)设计和组装流程更加简化的用户,可考虑选用外形扁平的扁平封装 (LQFP),如 144 引脚 R7FA8M1AHECFB#AA0。
AI 应用的开发环境
对 RA8M1 系列感兴趣的设计人员可以从 EK-RA8M1 R7FA8M 评估板开始(图 4)。该评估板包括一个 RJ45 RMII 以太网接口、一个 USB 高速主机和设备接口以及一个三针 CAN FD 插座。在内存方面,该评估板配备 64 MB 的八进制 SPI 存储器。
图 4:EK-RA8M1 评估板具有强大的 I/O 支持功能,可用于 RA8M1 MCU。(图片来源:Renesas)
RA8M1 由 Renesas Flexible Software Package (FSP) 提供支持,FSP 是一种综合框架,旨在为嵌入式系统设计提供可扩展、高质量的用户友好型软件基础。
该软件包提供开发工具,包括基于流行的 Eclipse IDE 的 e² studio 集成开发环境 (IDE)。该软件包还包含两个著名的免费实时操作系统:Azure RTOS 和 FreeRTOS。
该软件包包括了支持嵌入式系统常见用例的轻型生产就绪型驱动程序。这些驱动程序与评估板相结合,成为开发人员使用 RA8M1 I/O 进行实验的捷径。
结语
RA8M1 为开发人员在边缘物联网应用中实施 AI 和 ML 工作负载提供了新的选择,它可以节省功耗、提高性能、降低复杂性并缩短上市时间。