作为全球首个量产落地的3D架构端侧AI协处理器系列,瑞芯微RK18家族凭借自研TSV 3D堆叠技术,彻底打破端侧大模型推理的“内存墙”瓶颈,成为AI硬件选型的核心焦点。本文整合瑞芯微官方2026年最新产品路线图、量产规格及技术披露,全面对比RK182X(量产款)、RK1810(超低功耗款)、RK1860(60+TOPS中高端款)、RK1880(120+TOPS高端款)、RK1899(250+TOPS旗舰款)全型号核心参数、特性差异与应用场景,为端侧AI硬件选型、技术布局提供精准参考,助力快速锁定适配方案。
一、全系列核心架构共性
RK18XX系列是瑞芯微专为端侧AI大模型推理打造的专用协处理器,全型号均采用自研3D堆叠封装(TSV)核心架构,也是全球首个量产落地的3D架构端侧AI协处理器系列,核心共性如下:
-
架构本质:采用“计算层NPU + 存储层DRAM垂直叠封”设计,层间通过数万IO互联,彻底解决端侧大模型推理的“内存墙”瓶颈,相比传统外置DRAM方案,带宽提升一个数量级,传输功耗降低30%以上,封装体积缩小50%。
-
产品定位:纯AI协处理器,不替代主SoC,通过PCIe/USB等高速接口与RK3588/RK3576等主芯片异构协同,主SoC负责系统调度与预处理,协处理器专注AI推理,可灵活适配多品牌主平台,降低客户AI硬件升级门槛。
-
生态兼容:全系列统一适配RKNN-Toolkit工具链,兼容TensorFlow/PyTorch等主流框架,原生支持OpenAI API接口,支持INT4/INT8/INT16/FP8/FP16/BF16全精度推理,对LLM/VLM/CNN三大类AI模型实现全兼容。
-
算力扩展:全系列均支持多芯片级联堆叠,可根据需求弹性扩容算力,满足不同量级的端侧AI部署需求。
二、各型号详细参数与特性详解
(一)已量产商用:RK182X系列(RK1820/RK1828)
RK182X是瑞芯微3D架构协处理器的首发量产型号,2025年11月正式上线,目前已实现十几个行业、超300家客户项目落地,是全系列中唯一量产商用的型号。
|
核心规格
|
详细参数
|
|---|---|
|
标称算力
|
20TOPS(INT8稠密算力)
|
|
子型号区分
|
RK1820:内置2.5GB DRAM,适配3B参数以内模型RK1828:内置5GB DRAM,适配3B-7B参数模型
|
|
CPU核心
|
3核64位RISC-V(SRV RV64GCB + VRV0/VRV1 RV64GCBV),每核集成FPU浮点运算单元
|
|
存储与带宽
|
3D堆叠2.5GB/5GB高带宽DRAM,理论峰值带宽1TB/s,支持eMMC 4.51外置存储
|
|
计算精度
|
原生支持INT4/INT8/INT16/FP8/FP16/BF16,优化W4A16大模型推理格式
|
|
高速接口
|
USB3.0、2×PCIe 2.0×1、RGMII千兆网口、I2S、GPIO等
|
|
多媒体能力
|
集成RGA硬件加速引擎,支持4K JPEG编解码
|
|
实测性能
|
Qwen2.5-3B模型TPS达152.21,Qwen2.5-7B模型TPS达70.27;YOLOv8s推理帧率35.41fps,多batch并行最高212.65fps
|
|
功耗表现
|
典型推理功耗<5W,待机功耗低至毫瓦级
|
|
核心优势
|
量产成熟度高、开发配套完善,3D架构带来3倍性能、6倍能效比提升,支持4颗芯片堆叠达80TOPS算力,端侧7B模型流畅运行无压力
|
|
核心应用场景
|
AI PC/平板、智能座舱、服务机器人、工业视觉、安防视频分析、智能家居中枢、端侧大模型推理盒
|
(二)规划待发布:RK1810(超低功耗款)
RK1810是全系列的超低功耗标杆型号,主打极致能效比,面向电池供电的微小型端侧设备,填补微功耗AI协处理器市场空白。
|
核心规格
|
官方披露信息
|
|---|---|
|
核心定位
|
3D架构协处理器超低功耗专用款,面向轻量级、电池供电的端侧AI场景
|
|
算力规划
|
官方未公布具体数值,定位轻量级AI推理,适配1B参数以内的端侧小模型
|
|
架构优化
|
延续3D堆叠核心架构,采用先进低功耗制程,简化NPU核心规模,极致优化待机与轻负载功耗,待机功耗达μA级,典型推理功耗<1W
|
|
模型适配
|
轻量级LLM/VLM、语音唤醒/关键词识别、低功耗视觉感知、传感器AI预处理模型
|
|
核心应用场景
|
AI可穿戴设备、智能耳机、超低功耗电池摄像头、物联网智能节点、便携医疗设备、玩具级AI设备
|
|
发布状态
|
官方路线图规划产品,2026年陆续推出
|
(三)规划待发布:RK1860(60+TOPS 中高端款)
RK1860是RK182X的直接迭代型号,官方明确2026年Q2计划上市,是全系列中首个落地的迭代升级款,主打中高端高能效比算力。
|
核心规格
|
官方披露信息
|
|---|---|
|
标称算力
|
64TOPS(INT8稠密算力,官方标称60+TOPS)
|
|
架构升级
|
3D堆叠架构优化,NPU核心规模大幅升级,提升多核并行与互联效率,制程升级,功耗比大幅优化
|
|
存储配置
|
内置2.5GB/5GB/10GB多版本高带宽DRAM,新增外接LPDDR存储扩展能力
|
|
核心升级点
|
内置8K视频解码硬件引擎,强化多模态视觉处理;优化大模型INT4/FP8推理效率,提升batch处理能力;支持3B~13B参数模型原生运行,可多芯片级联
|
|
性能目标
|
Token生成速度较RK182X翻倍,显著降低大模型首帧延迟,CNN推理帧率大幅提升
|
|
核心应用场景
|
中高端智能座舱域控制器、高端具身智能机器人、工业超高清视觉质检、多模态边缘计算节点、AI NAS、高端AI PC加速卡
|
|
发布状态
|
官方明确2026年Q2上市,研发推进中,已开放客户送样预告
|
(四)规划待发布:RK1880(120+TOPS 高端款)
RK1880是全系列的高端算力型号,填补RK1860与旗舰款RK1899之间的算力空白,面向中高端边缘超算与车规级场景。
|
核心规格
|
官方披露信息
|
|---|---|
|
标称算力
|
120+TOPS(INT8稠密算力)
|
|
架构升级
|
3D堆叠架构全面优化,NPU多核Mesh架构规模大幅扩大,提升多线程并行推理效率,优化多芯片堆叠的调度延迟,原生支持多芯片高速互联
|
|
存储配置
|
内置大带宽高容量DRAM,支持更大容量片上存储,满足13B~34B大模型本地化部署带宽需求
|
|
接口升级
|
升级高速PCIe 3.0接口,提升与主SoC的互联带宽,优化多芯片级联通信协议
|
|
模型适配
|
原生支持7B~34B参数规模LLM/VLM,支持多模型并行推理,多芯片堆叠可实现算力翻倍
|
|
核心应用场景
|
L2+级辅助驾驶域控制器、高端工业AI边缘服务器、多通道超高清安防分析、城市智慧节点、大型具身智能机器人中枢、本地大模型推理服务器
|
|
发布状态
|
官方路线图规划产品,2026年陆续推出
|
(五)规划待发布:RK1899(250+TOPS 旗舰款)
RK1899是全系列的旗舰算力型号,主打边缘端超高算力,是瑞芯微面向自动驾驶、工业超算等高端场景的核心产品,4颗芯片堆叠可突破1000TOPS算力。
|
核心规格
|
官方披露信息
|
|---|---|
|
标称算力
|
250+TOPS(INT8稠密算力),4颗堆叠可突破1000TOPS
|
|
架构升级
|
3D堆叠架构全面革新,NPU多核Mesh架构规模最大化,原生支持多芯片互联堆叠,优化芯片间通信协议与算力调度效率,互联延迟大幅降低,采用先进制程,兼顾超高算力与能效比
|
|
存储配置
|
内置超大容量高带宽DRAM,支持片外高速存储扩展,满足超大参数模型本地化部署的带宽需求
|
|
核心升级点
|
全精度推理优化,提升FP16/BF16训练与推理能力,兼顾端侧模型微调与推理;支持车规级功能安全,升级PCIe 3.0/4.0高速接口
|
|
模型适配
|
原生支持7B~70B参数规模LLM/VLM,支持端侧模型微调,多芯片堆叠可实现百亿级参数模型本地化运行
|
|
核心应用场景
|
L3+级自动驾驶/城市NOA、车规级舱驾融合域控制器、工业级边缘超算中心、大型多模态AI推理服务器、高端人形机器人主算力中枢、超高清多通道工业视觉系统
|
|
发布状态
|
官方路线图规划产品,2026年陆续推出
|
三、全系列核心参数综合对比表
|
型号
|
标称算力(INT8)
|
核心定位
|
内置DRAM
|
适配模型规模
|
量产/发布状态
|
核心功耗特点
|
|---|---|---|---|---|---|---|
|
RK1810
|
未公布(轻量级)
|
超低功耗微端场景
|
未公布
|
1B以内
|
2026年规划
|
极致低功耗,推理功耗<1W
|
|
RK182X
|
20TOPS
|
端侧大模型普及款
|
2.5GB/5GB
|
3B~7B
|
已大规模量产
|
均衡能效,典型功耗<5W
|
|
RK1860
|
60+TOPS
|
中高端高能效款
|
2.5GB/5GB/10GB
|
3B~13B
|
2026年Q2计划上市
|
性能功耗比优化,算力密度提升
|
|
RK1880
|
120+TOPS
|
高端边缘算力款
|
高容量大带宽DRAM
|
7B~34B
|
2026年规划
|
高算力兼顾能效,支持多芯片堆叠
|
|
RK1899
|
250+TOPS
|
旗舰级边缘超算款
|
超大容量高带宽DRAM
|
7B~70B
|
2026年规划
|
超高算力,车规级可靠性优化
|
四、差异化分析与选型建议
-
入门级端侧普及场景:优先选择RK182X系列,量产成熟度最高、开发配套完善、成本可控,能满足绝大多数端侧3B/7B大模型的部署需求,是目前唯一可直接落地商用的选择。
-
电池供电/微功耗场景:等待RK1810,其极致的低功耗设计是可穿戴、电池物联网设备的唯一适配选择,主打μA级待机与<1W推理功耗,适配轻量级AI感知场景。
-
中高端机器人/智能座舱场景:优先规划RK1860,60+TOPS算力可流畅运行13B大模型,新增8K视频解码能力,完美适配高端具身机器人、中高端智能座舱的多模态需求,2026年Q2即可落地。
-
边缘服务器/高阶辅助驾驶场景:选择RK1880,120+TOPS算力可满足34B大模型本地化运行,适配多通道视觉分析、高阶辅助驾驶的高算力需求,填补中高端与旗舰之间的算力空白。
-
自动驾驶/工业超算旗舰场景:选择RK1899,250+TOPS单颗算力,4颗堆叠可突破1000TOPS,是瑞芯微面向L3+自动驾驶、工业边缘超算的旗舰方案,可实现百亿级参数大模型端侧部署。
五、补充说明
-
除RK182X系列外,其余型号均为瑞芯微官方路线图披露的规划产品,最终量产参数、发布时间可能随研发进度调整,本文参数均来自官方2026年1月最新披露的技术规划。
-
全系列均为AI专用协处理器,无法独立运行操作系统,必须搭配主SoC(如RK3588/RK3576)协同工作,通过PCIe/USB接口实现算力扩展。
-
全系列均延续瑞芯微RKNN工具链生态,已基于RK182X完成的模型适配,可无缝迁移至后续迭代型号,大幅降低客户开发迭代成本。












