日前,国内头部芯片IP设计与服务供应商安谋科技推出其自研人工智能(AI)产品线的最新AI处理器产品——“周易”X2 NPU,将支持的算力提至最高320TOPS,针对车载、电脑、手机等特定场景做了性能优化,并正式发布NPU软件开源计划,加速国内NPU产业生态的建设。
目前,“周易”X2 NPU已面向客户正式交付,今年会有多款搭载该NPU的芯片产品面世。
AI应用作为生产工具获得认可,需求飞速增长
发展通用人工智能是计算机行业一直以来的伟大梦想,而大模型与生成式AI取得的突破性进展,正以日新月异的速度缩短现实与想象之间的距离,也正重新制定AI芯片的规则。人机交互、文本内容创作、辅助代码、图像生成、视频生成等能力已经开始进入人们的生产活动中,以GhatGPT为代表的应用能力出众,获得大众的认可,AI领域的杀手级应用已经诞生。
边缘AI的算力需求也逐步提高。随着AI技术的进步,越来越多的AI应用被部署在边缘设备上,如汽车、手机、智能家居等。这些边缘设备对AI处理器的算力要求不断提高,需要支持更大的模型、更高的推理频率和更高的分辨率。 安谋科技推出的“周易”X2 NPU正是针对这些需求而设计的,它支持最高320TOPS的算力,可以运行更大和更复杂的AI模型;同时提供多种精度的支持,满足不同场景下的算力需求;还提供定制化的AI解决方案,能够针对不同应用场景提供定制优化,更好地满足客户的需求。 随着AI技术的进步和应用的扩展,边缘AI算力需求的提高将是未来发展的重要方向。
“周易”X2 NPU升级:更高算力、更多精度,支持差异化定制
“周易”X2 NPU基于第三代“周易”架构,支持多核Cluster,子系统最高算力可达320TOPS。在精度方面,该NPU支持更多的浮点格式以及int4/int8/int12/int16/int32、fp16/bf16/fp32多精度融合计算,将计算效率与密度显著提升,从而更好支持通用算法。
在灵活性方面,“周易”X2 NPU在支持自定义算子、满足各种模型部署需求的基础上,还面向各类应用场景提供定制化AI解决方案,以进一步满足客户在智能驾驶、手机影像AI处理、人机交互等场景中的差异化需求。
“周易”X2 NPU针对高级驾驶辅助系统(ADAS)、智能座舱、平板电脑、台式机、手机等应用场景做了大量的性能优化,可大幅提升手机拍照、录像中的高分辨率图像处理能力,以及车载中常用的Transformer等应用的性能,同时采用i-Tiling技术大幅减少带宽需求,进一步提升计算效率。
相比其他汽车SoC和“周易” X1 SoC,在“周易” X2 SoC上跑Swin-Transformer模型的性能显著提升。
从自研产品线来看,安谋科技正不断完善自研矩阵版图,同步推进CPU、NPU、ISP、VPU、SPU等各类IP产品线的研发。此前其自研产品已向160家本土客户授权,基于安谋科技自研IP的芯片出货量超过2亿颗。
软件才是杀手锏
安谋科技今日发布了NPU软件开源计划,通过开放源码,来满足客户更自主、更灵活的算法移植需求,和更多开发者及合作伙伴共建国内NPU产业生态。
“周易”NPU软件栈
这个软件平台支持TensorFlow、Caffe、ONNX、 PyTorch等主流AI框架,Android、Linux、RTOS、QNX等不同操作系统,以及TVM、Arm NN的SoC异构计算,并拥有丰富的开放接口、调试工具和Bit精度的软件仿真平台。
“周易”NPU软件部署
在该开源计划下,安谋科技率先对外开放NPU中间表示层规范、模型解析器、模型优化器、驱动等,并向相关合作伙伴提供“周易” Compass软件平台,包括软件模拟器、调试器、C编译器等在内的多种软件工具。
“周易”NPU开源计划
据了解,安谋科技已分别在代码托管平台Gitee、GitHub上建立该项目的开源库。上述只是“周易”NPU软件开源计划的第一步,安谋科技后续还将逐步开放更多资源,如模型优化器、模型量化、算子实现等源代码。
安谋科技将软件和工具链开源后,企业开发者可借此快速开发出自己的产品,或者是用这些工具结合对自家应用的深刻理解,从软硬件结合的角度对底层IP性能做优化。
除了NPU软件开源计划外,安谋科技还基于2022年7月发起的生态伙伴计划,通过战略合作、产品技术支持、项目协作、联合营销等形式,与合作伙伴共建上下游产业生态,共同推动各领域软硬件、工具链、行业标准以及社区联盟等生态环节的发展。
结语:
生成式AI的火爆推动了AI研发和商用,各类硬件终端智能化加强,对AI芯片作为基础设施的要求提高。快速迭代的AI算法、日趋广泛的应用场景,离不开高性能NPU和易用软件平台。安谋科技采用更强NPU和开放源码,拉更多开发者合作,共同加快NPU生态建设。