RISC-V R-Extension:革新边缘设备DNN处理的效率与智能
摘要
本文由Sungkyunkwan University的研究团队提出,针对边缘设备上深度神经网络(DNN)推理任务的效率问题,引入了一种名为RISC-V R-extension的新型架构扩展。该扩展通过创新的rented-pipeline机制和使用architectural pipeline registers(APR),显著优化了关键操作的执行,减少了延迟和内存访问频率。此外,R-extension还包括新的自定义指令,以支持这些架构改进。通过全面的分析,研究显示R-extension在边缘设备处理中提供了显著的性能提升,为更响应和智能的边缘应用奠定了基础。
原理
RISC-V R-extension的核心创新在于rented-pipeline机制和APR的使用。Rented-pipeline允许处理器在执行特定指令时租用内存(MEM)阶段,从而在执行过程中消耗两个阶段而不增加阶段数或关键路径延迟。APR位于MEM/write-back(WB)流水线寄存器上,用于持续更新累积结果,减少了MAC操作中对内存的读写需求。此外,R-extension引入了两个新的自定义指令rfmac.s和rfsmac.s,分别用于单精度浮点MAC操作和存储单精度浮点MAC操作结果,进一步优化了指令计数和内存使用。
流程
R-extension的工作流程涉及在DNN处理中使用新的自定义指令和优化过的流水线阶段。例如,在卷积操作中,rfmac.s指令用于执行乘法和累加操作,而rfsmac.s指令用于在累加结束后将结果从APR写回目标寄存器并重置APR。这种流程通过减少内存访问和优化指令执行,显著提高了处理速度和效率。具体示例可以在论文的图1中找到,展示了不同架构下的卷积代码和汇编语言。
应用
RISC-V R-extension的应用前景广阔,特别适用于资源受限的边缘设备,如家用电器和物联网设备。由于其高效的DNN处理能力和低功耗特性,该扩展有望在智能家居、工业自动化和可穿戴设备等领域发挥重要作用。随着边缘计算和人工智能的进一步融合,R-extension将为这些领域提供更高效、更智能的解决方案。
