玄铁C950是一款高性能64位多核CPU IP。它采用8发射解码的超标量乱序微架构,集成TAGE/ITTAGE分支预测、宽ALU执行流水线、私有二级缓存、动态自适应硬件预取器等先进微架构技术,实现高性能与高稳定性。该产品兼容RISC-V RVA23规范,支持向量加密、Zacas、Zama16b等所有可选扩展指令集。此外,玄铁C950支持自研玄铁AME(矩阵附加扩展)指令集架构,可与玄铁TPE(张量处理引擎)IP无缝集成。
玄铁C950面向云计算、边缘计算、人工智能计算等各类高性能应用场景。
特性
| 特性 | 说明 |
| 架构 | RVA23规范 |
| 流水线 | 8发射解码的超标量乱序微架构 |
| 浮点运算 | RISC-V F/D扩展指令集 |
| 向量运算 | 支持向量加密扩展的RISC-V向量指令集v1.0 |
| 矩阵运算 | 玄铁TPE协处理器集成(AME v0.5) |
| 虚拟化 | 适配1类与2类虚拟化管理程序 |
| 缓存系统 | 私有一级、二级缓存;可选共享三级缓存 |
| 内存管理单元 | 支持Sv57/Sv48/Sv39虚拟地址与PA48物理地址 |
| 总线接口 | 直连模式:CHI.E/CHI.F;多核模式:AXI4.0 |
| 安全特性 | CFI(landing pad、影子栈)/Smmtt |
| 服务质量 | CBQRI(容量与带宽控制器服务质量寄存器接口)、Ssqosid(服务质量标识) |
| 中断系统 | 高级中断架构(AIA)v1.0 |
| 调试功能 | RISC-V调试规范v1.0 |
| 跟踪功能 | RISC-V Nexus跟踪规范v1.0 |
| 可靠性、可用性、可服务性 | RERI(RAS错误记录接口) |
技术亮点
向量处理
双256位数据通路向量引擎(向量长度VLEN=256位),完全兼容RISC-V向量指令集v1.0与向量加密扩展,覆盖整数、浮点及面向人工智能的微缩放格式等全品类数据类型。
宽位向量引擎显著提升多媒体编解码、信号处理、图像处理与科学计算等数据并行负载的吞吐率。向量加密扩展为AES、SHA等加密算法提供硬件加速,以极低的软件开销实现高性能安全通信与存储加密。
核心特性:
- 支持浮点元素类型:BF16/FP16/FP32/FP64(元素宽度SEW=16/32/64)
- 支持整数元素类型:INT4/INT8/INT16/INT32/INT64(元素宽度SEW=8/16/32/64)
- 玄铁向量转换指令扩展:支持FP4/FP8/MX缩放数据格式转换
AI加速
玄铁C950支持可选集成玄铁TPE(张量处理引擎)——一款基于玄铁矩阵扩展架构的人工智能协处理器。TPE支持从FP16到INT4/FP8及微缩放格式(MXFP8/MXFP4/RVFP4)的全品类数据类型。
玄铁TPE为生成式人工智能、大语言模型推理与计算机视觉提供强劲硬件加速。其丰富的低精度与微缩放数据类型支持实现灵活的模型部署,在保障推理精度的同时显著提升吞吐率与能效。片上张量缓存、本地内存搭配DMA引擎,最小化数据搬移延迟,最大化计算利用率。矩阵引擎与向量引擎可并行执行,加速Softmax、SiLU、GELU等全推理算子流水线。
核心特性:
- 单TPE算力最高可达8TOPS
- 支持数据类型:INT4/INT8/FP8/MXFP8/MXFP4/RVFP4/FP16/BF16
内存子系统
内存子系统采用高性能多级缓存架构:一级数据缓存加载到使用延迟极低,仅4周期;每个核心配备私有二级缓存,支持大容量配置;内存管理单元支持多种RISC-V虚拟内存模式与两级地址转换。
低延迟一级缓存与大容量私有二级缓存保障高频下持续的数据供给,最小化流水线停顿。多种虚拟内存模式为操作系统与虚拟化场景提供灵活支持,两级地址转换原生满足基于虚拟化管理程序的虚拟化需求。
核心特性:
- 一级数据缓存:64KB,4路组相联,4周期加载到使用延迟
- 二级缓存:单核心私有,最大可配置3MB
- 内存管理单元:支持Sv39/Sv48/Sv57虚拟内存寻址模式,两级地址转换
总线接口
灵活的总线互联架构同时支持直连模式与多核模式,适配多样化的系统集成需求。
直连模式通过点对点链路实现最大带宽与最低延迟,适用于高性能单芯片设计。多核模式借助XL-300互联架构组建最多8核的集群,满足服务器、网络等高吞吐场景的多核并行计算需求。
核心特性:
- 直连模式:AMBA CHI.E/CHI.F协议,256位数据位宽
- 多核模式:XL-300互联,单集群最多8核,AMBA AXI4.0协议
中断子系统
高级中断架构兼容RISC-V AIA v1.0标准。每个核心内置IMSIC(入站消息信号中断控制器),支持多个监管域与物理中断文件。
兼容AIA的中断架构为复杂片上系统设计提供高效、可扩展的中断管理,原生支持消息信号中断(MSI),降低中断分发延迟。多域设计支持可信执行环境(TEE)与虚拟化场景的中断隔离。
核心特性:
- 兼容RISC-V AIA v1.0
- 单核心内置IMSIC(入站消息信号中断控制器)
- 2个监管域,每个域配备5个物理中断文件
跟踪与调试
遵循RISC-V标准调试与跟踪规范,提供完备的调试与跟踪能力,支持多种触发类型与高效的跟踪数据存储方案。
标准化调试接口与丰富的触发类型助力开发者快速定位软硬件问题,缩短开发周期。跟踪数据分散内存访问方案将跟踪数据直接写入系统内存,无需专用跟踪缓存,降低硬件成本的同时支持更长时间的跟踪会话。兼容主流商用调试工具,确保无缝融入现有开发环境。
核心特性:
- 调试:兼容RISC-V调试规范0
- 跟踪:兼容RISC-V Nexus跟踪规范0,支持跟踪数据分散内存访问
- 支持工具:玄铁调试工具、Trace32
处理器配置选项
核心级配置选项
| 特性 | 可选配置 |
| 二级缓存容量 | 256KB/512KB/1024KB/2048KB/3072KB |
| 核心内存纠错码/奇偶校验 | 支持/不支持 |
| 向量单元 | 支持/不支持 |
| 向量加密 | 支持/不支持 |
| 张量处理引擎(TPE) | 支持/不支持 |
| 协处理器接口 | 支持/不支持 |
集群级配置选项
| 特性 | 可选配置 |
| 直连模式 | 支持:直连模式;不支持:多核模式(通过XL-300) |
| 核心数量 | 1/2/3/4/5/6/7/8 |
| 侦听过滤器容量 | 512KB/1MB/2MB/4MB/8MB/16MB |
| 三级缓存容量 | 0MB/1MB/2MB/3MB/4MB/6MB/8MB/12MB/16MB/24MB/32MB |
| 主存访问端口协议 | 直连模式:CHI.E/CHI.F;多核模式:AXI4.0 |
| 主存访问端口数量 | 直连模式:1;多核模式:1/2/3/4 |
| 主存访问端口数据位宽 | 直连模式:256位;多核模式:128位/256位 |
| 低延迟端口(LLP)数量 | 0/1/2/3 |
| 设备一致性端口(DCP)数量 | 0/1/2/3 |
| 设备一致性端口数据位宽 | 128位/256位 |
| 三级缓存/侦听过滤器纠错码 | 支持/不支持 |
注:标注*的配置仅在多核模式下有效
软件生态
- 编译器、汇编器、链接器、调试器与二进制工具已贡献至GNU/LLVM并获得官方支持
- QEMU已贡献并获得官方支持
- 性能优化的运行时库
- 集成开发环境(CDS)
- 多操作系统支持












