日前,智谱正式发布了新一代大模型 GLM-4.6,与此同时,寒武纪和摩尔线程迅速完成了与 GLM-4.6 的适配工作,这一举措为我国自主 AI 生态的完善注入了强大动力,标志着国内 AI 产业在自主可控的道路上迈出了坚实的一步。
GLM-4.6:国产大模型的新高度
GLM-4.6 作为智谱的最新力作,一经发布便展现出了卓越的性能和多项突破性的创新成果。
- 代码能力卓越:GLM-4.6 是国内首个代码能力对齐 Claude Sonnet4 的大模型。在八大权威基准测试中,它成为首个在部分榜单表现对齐 Claude Sonnet4/Claude Sonnet4.5 的国产模型,稳居国产模型首位。在 74 个真实场景编程任务测试中,其实测成绩超过了 Claude Sonnet4,成为国内开发者当之无愧的 “编程利器”。
- 效率大幅提升:与前代产品 GLM-4.5 相比,GLM-4.6 在平均 token 消耗上节省了 30% 以上,成为同类模型中 token 消耗最低的佼佼者,大大提高了模型的运行效率和经济性。
- 多性能指标进步:在上下文长度方面,GLM-4.6 的上下文窗口由 128K 提升至 200K,能够更好地适应更长的代码和智能体任务。推理能力也得到了显著提升,并且支持在推理过程中调用工具,增强了模型的实用性。在搜索能力上,GLM-4.6 强化了模型的工具调用和搜索智能体,在智能体框架中表现更为出色。其写作能力也有了质的飞跃,在文风、可读性与角色扮演场景中更符合人类偏好。
适配寒武纪:开启国产芯片量化推理新路径
智谱官方宣布,GLM-4.6 已在寒武纪领先的国产 AI 芯片上实现了 FP8+Int4 混合量化推理部署。
- 技术突破意义重大:这是首次在国产芯片上投产的 FP8+Int4 模型 — 芯片一体化解决方案。FP8 数据类型具有动态范围广、精度损失小的特点,而 Int4 数据类型则压缩比极高,内存占用最少,尽管适配低算力硬件时精度损失相对明显,但二者结合在保持模型精度不变的前提下,大幅降低了推理成本,为国产芯片本地化运行大模型提供了可行路径和示范意义,打破了以往大模型在国产硬件上部署运行受制于国外技术的局面。
- 推动产业协同发展:寒武纪作为国内 AI 芯片领域的重要企业,其与 GLM-4.6 的适配,不仅展示了寒武纪芯片强大的性能和对前沿大模型的支持能力,也为国产大模型与国产芯片的深度协同发展提供了成功范例,将推动整个 AI 产业上下游的紧密合作,加速国产 AI 技术在更多领域的应用和落地。
牵手摩尔线程:验证国产 GPU 生态兼容性
摩尔线程基于 vLLM 推理框架也完成了对 GLM-4.6 的适配,其新一代 GPU 可在原生 FP8 精度下稳定运行 GLM-4.6。
- 生态兼容能力凸显:这充分验证了摩尔线程 MUSA 架构及全功能 GPU 在生态兼容性和快速适配能力方面的优势,表明国产 GPU 已经具备了与前沿大模型协同迭代的能力,能够为大模型的运行提供强大的图形处理和计算支持,进一步丰富了国产 AI 硬件的生态体系。
- 拓展应用场景边界:摩尔线程与 GLM-4.6 的适配,为大模型在更多复杂场景下的应用提供了可能,比如在图形渲染、人工智能视觉等领域,将推动相关行业的创新发展,为用户带来更优质的体验和更高效的解决方案。
自主 AI 生态:从愿景走向现实
寒武纪和摩尔线程完成对 GLM-4.6 的适配,对于我国自主 AI 生态的建设具有深远意义。
- 构建全自主生态体系:这一成果标志着我国在构建自主可控的 AI 技术生态方面取得了实质性进展,实现了从算法到硬件的全链条自主化,减少了对国外技术的依赖,提高了我国 AI 产业的安全性和稳定性。
- 加速产业发展进程:国产大模型与国产芯片的深度协同,正加速进入新阶段,朝着软硬协同的统一生态演进。这将在模型训练和推理环节持续推动性能与效率的双重优化,为国内 AI 产业的发展提供更强大的基础设施支持,有望进一步加速国内 AI 产业的发展,提升我国在全球 AI 领域的竞争力。
- 释放社会与产业价值:GLM-4.6 搭配国产芯片的组合将率先通过智谱 MaaS 平台面向企业与公众提供服务,能够为各行各业提供更高效、更智能的解决方案,释放更广泛的社会与产业价值,助力我国数字经济的快速发展和智能化转型。
开源共享:推动全球 AI 发展
目前,GLM-4.6 已上线智谱 MaaS 平台bigmodel.cn,并遵循宽松的 MIT 开源协议,即将在 Hugging Face、ModelScope 同步开源。
- 提升国产模型影响力:作为开源模型,GLM-4.6 目前是全球开源生态中性能最强的通用大模型之一,这一举措进一步提升了国产大模型在全球竞争格局中的地位,让世界看到了中国在 AI 领域的创新实力和开放合作的态度。
- 促进全球 AI 技术交流:开源将吸引全球开发者参与到 GLM-4.6 的应用和迭代中来,加速国产大模型在全球范围内的推广和应用,促进全球 AI 技术的交流与合作,推动 AI 技术的快速发展和普及。
智谱 GLM-4.6 的发布以及与寒武纪、摩尔线程的适配,是我国 AI 产业发展的一个重要里程碑,为自主 AI 生态的完善奠定了坚实基础。随着技术的不断进步和产业的持续发展,我们有理由相信,国内 AI 产业将在自主可控的道路上取得更加辉煌的成就,为全球 AI 发展贡献更多的中国智慧和中国方案。未来,我们期待看到更多的国产大模型与国产芯片实现深度协同,共同推动 AI 技术在各个领域的广泛应用,为人类社会的进步和发展带来更多的惊喜和变革。