华为开源盘古大模型,推动 AI 创新
2025 年 6 月 30 日,华为技术有限公司正式宣布开源盘古 70 亿参数的稠密模型、盘古 Pro MoE 720 亿参数的混合专家模型以及基于昇腾的模型推理技术,此举标志着华为在践行昇腾生态战略道路上迈出了关键一步,将为大模型技术的研究与创新发展注入强大动力,加速人工智能在众多行业的应用与价值创造。
开源内容及技术亮点
-
盘古 Pro MoE 72B 模型 :该模型权重、基础推理代码和基于昇腾的超大规模 MoE 模型推理代码已正式上线开源平台。其采用混合专家架构,在参数量仅为 720 亿、激活 160 亿参数量的情况下,通过动态激活专家网络的创新设计,实现了以小打大的优异性能,媲美千亿级模型,在业界权威大模型榜单 SuperCLUE 2025 年 5 月排行榜中,位居千亿参数量以内大模型排行并列国内第一。
-
盘古 7B 稠密模型 :相关模型权重与推理代码将于近期上线开源平台。该模型是灵活切换快慢思考的高效模型,在单一、统一的架构内实现了快速响应和高质量推理的灵活切换。且在多个权威的复杂推理基准测试中,其表现优于 Qwen3-8B 和 GLM4-9B 等规模相近的业界领先模型。
开源的重要意义
-
推动技术研究与创新 :盘古大模型开源后,全球开发者、企业伙伴及研究人员可下载使用,并反馈意见,这将有助于凝聚各方力量,共同探索大模型技术的前沿领域,推动大模型技术的不断创新和完善,进一步拓展大模型的技术边界。
-
加速行业应用与价值创造 :盘古大模型已在金融、制造、能源、交通等 30 多个行业、500 多个场景中落地,助力企业实现智能化升级。开源后,更多行业用户可基于盘古大模型开发适合自身业务需求的智能化解决方案,降低开发成本和门槛,加快人工智能在千行百业的落地应用,促进各行业的数字化转型和创新发展,为行业创造更大的价值。
-
完善昇腾生态 :作为华为昇腾生态战略的重要组成部分,盘古大模型的开源将进一步丰富昇腾生态的技术资源和应用场景,吸引更多开发者和企业加入昇腾生态,加强昇腾生态在人工智能领域的影响力和竞争力,推动形成一个开放、合作、共赢的 AI 生态环境,为人工智能产业的发展提供有力支撑。
华为的 AI 布局与愿景
华为一直致力于推动人工智能技术的发展和应用,盘古大模型是华为在 AI 领域的重要成果之一。此前,在 6 月 20 日的华为开发者大会 2025 上,华为云发布了盘古大模型 5.5,对自然语言处理、计算机视觉、多模态、预测、科学计算五大基础模型进行了升级,并推出了基于 CloudMatrix 384 超节点的新一代昇腾 AI 云服务,为大模型应用提供强大算力支持。此次开源盘古大模型,体现了华为在 AI 领域的开放合作态度和对技术创新的不懈追求,未来华为将继续加大在 AI 研发和应用方面的投入,携手各方共同推动人工智能技术的快速发展,为社会和经济的智能化转型贡献力量。
结语:
华为开源盘古大模型,无疑是人工智能领域的一大重要事件。这不仅为研究人员和开发者提供了宝贵的资源,也将加速人工智能技术的普及和应用,助力千行百业实现智能化升级,让我们共同期待这一开源举措为 AI 产业发展带来的积极变化。