人工智能 (AI)、机器学习 (ML) 和物联网 (IoT) 网络边缘的其他计算密集型工作负载的兴起给微控制器 (MCU) 带来了额外的处理负载。 即使设计人员被要求最大限度地降低功耗并加快上市时间,处理这些新的工作负载也会增加功耗。
设计人员需要一种计算选项,既能保持 MCU 的效率,又能添加专门针对低功耗用例定制的高性能功能。 此选项还应保留与传统 MCU 相关的简单部署模型,同时添加足够的功能来支持 AI 和 ML 启用的复杂应用程序,例如语音控制和预测性维护。
本文讨论了推动人工智能和机器学习需求的因素,并解释了为什么需要新的处理器架构来有效地提供这些功能。 然后介绍瑞萨电子的 RA8M1 MCU 系列,并展示如何使用它来满足这些要求。
边缘AI和ML的要求
从楼宇自动化、工业设备到家用电器,边缘物联网应用对人工智能和机器学习的需求不断增加。 即使是相对较小的低功耗嵌入式系统现在也承担着关键字识别、语音命令控制和音频/图像处理等工作负载。 目标应用包括传感器集线器、无人机导航和控制、增强现实 (AR)、虚拟现实 (VR) 和通信设备。
为了最大限度地减少能源使用、开销和延迟,同时确保隐私,通常首选在边缘处理数据,而不是将其发送到云端。 这对设计人员来说是一个挑战,因为边缘设备通常资源有限,特别是在电池供电时。
用于边缘计算的增强型 MCU
AI 和 ML 工作负载通常涉及在大型数据集中重复执行相同的数学运算。 这些工作负载可以使用单指令、多数据 (SIMD) 处理进行加速。 SIMD 并行执行多项数学运算,与传统处理相比,可提供更高的吞吐量和更高的能效。
由于传统 MCU 缺乏 SIMD 功能,因此它们需要帮助执行 AI 和 ML 工作负载。 一种解决方案是与 MCU 一起使用数字信号处理器 (DSP) 或其他 SIMD 加速器。 然而,这种多处理器方法使系统设计变得复杂。
另一种选择是改用配备 SIMD 功能的更高性能微处理器单元 (MPU)。 这可以在单处理器设置中提供必要的性能,但 MPU 在功耗和功能集方面需要权衡。 例如,并非所有 MPU 都旨在提供面向 MCU 的应用程序所需的确定性、低延迟计算。
在 MCU 中启用 AI 和 ML
瑞萨电子认识到需要一套优化的 MCU 来支持 AI 和 ML 工作负载,因此推出了 RA8M1 MCU 系列(图 1)。 该系列基于配备 Helium 和 TrustZone 的 Arm Cortex-M85 架构,运行频率为 480 兆赫 (MHz),典型功耗为 225μA/MHz。
图 1:Renesas RA8M1 MCU 基于 Arm Cortex-M85,并采用 Helium 技术来加速 AI 和 ML 处理。 (图片来源:瑞萨)
RA8M1 MCU 专为高性能和低功耗而设计,具有确定性、短中断时间和最先进的电源管理支持等功能。 该处理器的性能效率达到 6.39 CoreMark/MHz。
Helium 是一种 SIMD M-Profile 矢量扩展 (MVE),可显着加速信号处理和 ML。 它添加了 150 个标量和向量指令,并支持 128 位寄存器的处理(图 2)。 它针对资源受限、低功耗的微控制器进行了优化。 例如,Helium 重用浮点单元 (FPU) 寄存器,而不是引入新的 SIMD 寄存器。 这有助于降低处理器的功耗并降低设计复杂性。
图 2:Helium 重用 FPU 寄存器组进行矢量处理。 (图片来源:Arm)
如图 3 所示,RA8M1 的 Cortex-M85 包含 Arm 的 TrustZone 技术。 TrustZone 为关键固件、资产和私人信息提供硬件隔离。 Cortex-M85 还添加了新的安全保障功能,例如指针身份验证和分支目标识别 (PACBTI) 扩展。 这些安全功能在设备可能与个人数据交互的人工智能环境中特别有价值。
图 3:Cortex-M85 的 TrustZone 为关键固件、资产和私人信息提供硬件隔离。 (图片来源:Arm)
支持 AI 的 MCU 需要具备的硬件功能
一个MCU 应将高效性能与强大的功能集结合起来,以支持人工智能应用。 RA8M1 配备齐全,适用于电机控制、可编程逻辑控制 (PLC)、计量以及其他工业和物联网应用。
例如,人工智能算法需要大量内存。 RA8M1 系统存储器包括高达 2 兆字节 (Mbytes) 的闪存和 1 MB 的 SRAM。其中SRAM 包括 128 KB 的紧耦合存储器 (TCM),可实现快速存储器访问以实现高性能计算。
为了确保可靠运行,384 KB 的用户 SRAM 和整个 128 KB TCM 被配置为纠错码 (ECC) 存储器。 32 KB 指令和数据高速缓存也受 ECC 保护。
除了 Arm 内核中包含的功能之外,RA8M1 还包含多种安全功能。 其中包括用于安全数据处理的可重编程安全知识产权 (RSIP) 加密引擎、用于关键数据保护的不可变存储以及篡改保护机制。
对于通信接口,MCU 配备了用于网络连接的以太网、用于汽车和工业应用的控制器局域网灵活数据速率 (CAN FD) 以及用于一般连接的 USB 高速/全速。 它还集成了一个摄像头接口和一个八进制串行外设接口 (SPI),可对外部存储器进行动态解密。
模拟接口包括 12 位模数转换器 (ADC) 和数模转换器 (DAC)、高速模拟比较器以及三个采样保持电路。 对于串行通信,RA8M1 支持多种协议,包括带 SPI 的串行通信接口 (SCI)、通用异步接收器/发送器 (UART) 和I²C。 该 MCU 还提供改进的I3C,以提高数据传输速率和效率。
需要完全访问这些输入/输出 (I/O) 功能的开发人员,可以使用球栅阵列 (BGA) 封装,例如 224 引脚 R7FA8M1AHECBD#UC0。 寻求更简化的印刷电路板 (PC 板) 设计和组装流程的用户可以考虑使用薄型四方扁平封装 (LQFP) 选项,例如 144 引脚 R7FA8M1AHECFB#AA0。
AI应用程序的开发环境
有兴趣尝试 RA8M1 系列的设计人员可以从 EK-RA8M1 R7FA8M 评估板开始(图 4)。 该板包括一个 RJ45 RMII 以太网接口、一个 USB 高速主机和设备接口以及一个三引脚 CAN FD 接头。 对于存储器,它具有 64 MB 八进制 SPI 闪存。
图 4:EK-RA8M1 评估板具有强大的 I/O 支持来测试 RA8M1 MCU。 (图片来源:瑞萨)
RA8M1 由瑞萨FSP支持,这是一个综合框架,旨在为嵌入式系统设计提供用户友好、可扩展且高质量的软件基础。
该软件包提供了开发工具,包括基于流行的 Eclipse IDE 的 e² studio 集成开发环境 (IDE)。 它还包含两个著名的免版税实时操作系统:Azure RTOS 和 FreeRTOS。
该软件包包括轻量级、生产就绪的驱动程序,支持嵌入式系统中的常见用例。 这些驱动程序与评估板相结合,为开发人员提供了快速试验 RA8M1 I/O 的途径。
结论
RA8M1 为开发人员提供了在边缘物联网应用中实施 AI 和 ML 工作负载的新选择,从而节省功耗、增强性能、降低复杂性并缩短上市时间。