Processor · In Progress

RISC-V 矩阵处理器

基于 RISC-V 的矩阵计算扩展原型,关注指令接口、矩阵寄存器和乘加阵列组织方式。

RISC-VVerilogSystemVerilogISASIMD
目录项目背景目标与约束系统架构算法设计硬件架构数据通路存储结构定点化方案RTL 实现验证方法综合或实现结果遇到的问题最终结论后续计划

项目背景

RISC-V 提供开放的 ISA 扩展空间,适合探索面向矩阵计算的专用处理结构。本项目记录原型设计思路,不表示已有完整处理器产品或正式发表成果。

目标与约束

  • 定义矩阵扩展的基本软件接口。
  • 设计矩阵寄存器文件和 MAC 阵列。
  • 保留可仿真的 RTL 验证路径。
  • 控制指令复杂度,先服务小规模矩阵乘。

系统架构

RISC-V Core
 ├─ Custom Decode
 ├─ Matrix Register File
 ├─ Matrix MAC Array
 └─ Load/Store Interface

算法设计

核心计算聚焦矩阵乘和累加,后续再考虑卷积 lowering 或直接卷积映射。

硬件架构

初始方案采用固定规模 MAC 阵列,矩阵寄存器负责提供局部操作数。

数据通路

数据从 load/store 接口进入矩阵寄存器,经 MAC 阵列计算后写回结果寄存器或内存。

存储结构

矩阵寄存器文件的端口数量是关键约束,需要在吞吐和面积之间折中。

定点化方案

初始考虑 int8 输入、int32 累加,具体饱和和舍入策略待验证。

RTL 实现

待补充指令译码、状态机、寄存器文件和 MAC 阵列的 RTL 细节。

验证方法

计划使用指令级测试、随机矩阵测试和 C 参考模型对拍。

综合或实现结果

待补充。当前不展示未确认的面积、时序或功耗指标。

遇到的问题

需要进一步明确异常处理、上下文保存、软件 ABI 和编译工具支持边界。

最终结论

本项目仍在原型设计阶段。

后续计划

补充指令编码草案、RTL 目录结构和最小仿真用例。

RISC-V 矩阵处理器的基本架构

从 ISA 扩展、寄存器组织、矩阵乘数据通路和软件接口角度整理 RISC-V 矩阵处理器原型思路。

我的数字集成电路设计工具链

从 Linux 环境、版本管理、仿真验证到综合时序检查,整理一个可复用的数字 IC 学习与研究工具链。

从算法模型到可综合 RTL 的完整流程

记录神经网络算子从 Python 模型、定点化、接口定义到可综合 RTL 的工程拆解方法。

ITCM、DTCM、Cache 和 SRAM 的区别

从处理器系统视角梳理 TCM、Cache 与 SRAM 的功能定位、访问特征和设计取舍。