在 9 月 24 日举行的 2025 阿里云栖大会上,通义千问团队带来了一场令人瞩目的 AI 盛宴,一口气发布了多个新品,涵盖安全、旅行规划、同声传译、编程、视觉语言等多个领域,展示了其在人工智能领域的强大技术实力和创新能力,为行业发展注入了新的活力。
开源安全模型 Guard:为 AI 安全保驾护航
9 月 24 日凌晨,通义千问团队发布了开源的安全模型 Guard,这是 AI 安全领域的一项重要创新。Guard 推出了 generative 和 streaming 两个版本,其中 streaming 版本能够接近实时判断是否安全。
在如今 AI 技术广泛应用的时代,安全问题至关重要。Guard 的出现为 AI 系统的安全性提供了有力保障。generative 版本可以通过生成式的方式对潜在的安全威胁进行分析和评估,为安全策略的制定提供依据。而 streaming 版本则能在数据流动的过程中,近乎实时地对数据进行安全检测,及时发现并处理可能存在的安全风险,大大提高了 AI 系统的安全性和可靠性。无论是在企业级应用还是个人用户场景中,Guard 都将发挥重要作用,为 AI 的安全应用筑起一道坚固的防线。
“千问旅行规划师”:个性化旅行规划专家
同样在 9 月 24 日凌晨,“千问旅行规划师” 正式发布。这是一款专为旅行者打造的智能工具,能够根据用户的需求生成详细的旅行计划,堪称旅行爱好者的得力助手。
“千问旅行规划师” 的功能十分强大,它不仅可以为用户规划出包括航班、酒店、餐饮、交通等费用明细的完整旅行方案,还能根据目的地的特点和用户的个人情况,提供贴心的行前准备建议。用户只需将自己的旅行需求输入,例如旅行时间、目的地、预算、偏好等,“千问旅行规划师” 就能迅速生成一份个性化的旅行计划,并且还可以将计划导出为 PDF 格式,方便用户随时查看和分享。无论是国内游还是境外游,无论是休闲度假还是商务出行,“千问旅行规划师” 都能满足用户的需求,让旅行变得更加轻松、便捷和有趣。
Qwen3-LiveTranslate 同声传译 API:打破语言沟通障碍
9 月 24 日凌晨,qwen3 – livetranslate 同声传译 API 正式上线。这一 API 的推出,为跨语言交流提供了更加便捷和高效的解决方案,尤其是对于阿里的电商业务来说,具有重要的战略意义。
qwen3 – livetranslate 同声传译 API 支持多种语言,能够实现实时的语音翻译,让不同语言的用户之间能够顺畅地交流。而且,该 API 还支持视觉理解,能够结合图像、视频等信息更好地理解语言的上下文,提高翻译的准确性和质量。在电商领域,这意味着阿里可以吸引更多来自不同国家和地区的用户,打破语言障碍,促进全球贸易的发展。无论是在线购物、跨境直播还是客户服务,qwen3 – livetranslate 同声传译 API 都将发挥重要作用,为用户提供更加优质的语言服务体验。
Qwen3 – Coder 编程模型 API 升级:编程领域新突破
9 月 24 日,Qwen3 – Coder 编程模型的 API 迎来了重大升级。这一升级使得 Qwen3 – Coder 在编程领域的表现更加出色,登顶全球开源模型阵营。
Qwen3 – Coder 拥有多个尺寸,能够满足不同用户和场景的需求。其强大的编程能力不仅体现在代码生成的速度和质量上,更体现在其具有的强大 Agent(智能体)特性上。与传统的代码补全工具相比,Qwen3 – Coder 能够更好地理解编程任务的上下文和意图,自主地进行代码编写和调试,大大提高了编程效率。无论是初学者还是专业的程序员,都能从 Qwen3 – Coder 中受益。它可以帮助初学者快速上手编程,提供详细的代码示例和解释;对于专业程序员来说,Qwen3 – Coder 则是一个强大的编程助手,能够协助完成复杂的项目开发,提高代码的质量和可维护性。
Qwen3 – VL:视觉 – 语言模型新巅峰
Qwen3 – VL 作为通义千问系列中迄今为止最强大的视觉 – 语言模型,在 9 月 24 日正式开源,为多模态人工智能的发展树立了新的里程碑。
其旗舰模型 Qwen3 – VL – 235B – A22B 提供了 Instruct 版和 Thinking 版,Instruct 版在关键视觉任务上超越了 Gemini2.5Pro。Qwen3 – VL 在视觉感知和多模态推理方面实现了重大突破,具有强大的视觉智能体和视觉 Coding 能力。它不仅能看懂图片,还能像人一样操作手机和电脑,自动完成许多日常任务。例如,输入一张图片,模型就可自行调用 agent 工具放大图片细节,通过更仔细的观察分析,推理出更好的答案。同时,该模型还升级了 3D Grounding(3D 检测)能力,为具身智能夯实了基础。此外,Qwen3 – VL 扩展支持百万 tokens 上下文,视频理解时长扩展到 2 小时以上。这使得 Qwen3 – VL 在图像识别、视频分析、智能交互等领域具有广泛的应用前景,能够为智能安防、自动驾驶、智能家居等多个行业提供强大的技术支持。
Qwen3 – Max:大语言模型的佼佼者
继 Qwen3 – 2507 系列发布之后,阿里巴巴在此次云栖大会上推出了 Qwen3 – Max,这是通义千问家族中的又一重磅产品。
Qwen3 – Max – Instruct 的预览版在 LMArena 文本排行榜上位列第三,超越了 GPT – 5 – Chat。而其正式版本在代码能力和智能体(agent)能力方面进一步提升,在涵盖知识、推理、编程、指令遵循、人类偏好对齐、智能体任务和多语言理解的全面基准测试中均达到业界领先水平。Qwen3 – Max 包括指令(Instruct)和推理(Thinking)两大版本,是通义千问家族中最大、最强的基础模型,预训练数据量达 36T,总参数超过万亿。在大模型用 Coding 解决真实世界问题的 SWE – Bench Verified 测试中,Instruct 版本斩获 69.6 分,位列全球第一梯队。其推理模型可结合工具调用和并行推理技术,尤其在聚焦数学推理的 AIME 25 和 HMMT 测试中,均达到突破性的满分 100 分,为国内首次。
Qwen3 – Next:下一代基础模型架构的创新
Qwen3 – Next 作为下一代基础模型架构及系列模型,在本次大会上也正式亮相。它的出现代表了通义千问在基础模型架构方面的创新探索和技术突破。
Qwen3 – Next 总参数 80B 仅激活 3B,性能却可媲美千问 3 旗舰版 235B 模型。这得益于其采用的混合注意力机制、高稀疏度 MoE 结构、多 token 预测(MTP)机制等核心技术。这些技术的应用使得 Qwen3 – Next 的训练成本较密集模型 Qwen3 – 32B 大降超 90%,长文本推理吞吐量提升 10 倍以上。Qwen3 – Next 为 AI 模型的发展提供了一种新的思路和方向,有望在未来的人工智能应用中发挥重要作用,为推动 AI 技术的普及和发展做出贡献。
通义万相 2.5:视觉基础模型的新飞跃
通义万相 2.5 属于视觉基础模型,在本次云栖大会上推出了 Wan2.5 – preview 系列模型,涵盖文生视频、图生视频、文生图和图像编辑四大模型。
其视频生成模型取得了重大突破,能生成和画面匹配的人声、音效和音乐 BGM,实现音画同步,生成时长从 5 秒提升至 10 秒,支持 24 帧每秒的 1080P 高清视频生成。这使得视频创作的门槛进一步降低,创作者可以更加轻松地制作出高质量的视频内容。同时,通义万相 2.5 提升了模型指令遵循能力,图像生成能力全面升级,可生成中英文文字和图表,支持图像编辑。无论是用于广告制作、影视创作还是教育培训等领域,通义万相 2.5 都能提供强大的视觉创作支持,为用户带来更加丰富和优质的视觉体验。
结语:
通义千问在 2025 阿里云栖大会上发布的这些新品,展示了其在人工智能领域的全面布局和深厚技术实力。从安全模型到旅行规划师,从同声传译 API 到各种大模型,每一个新品都具有独特的创新点和应用价值,将为人工智能在各个领域的应用和发展带来新的机遇和挑战。相信在通义千问等优秀 AI 产品的推动下,人工智能将更好地服务于人类社会,为人们的生活和工作带来更多的便利和创新。