2025 年 5 月 28 日,人工智能公司 DeepSeek 宣布了其 R1 推理模型的最新版本 DeepSeek R10528 的发布。
此次发布的 DeepSeek R1-0528 模型参数量达到 6850 亿,采用纯强化学习训练方式,具备出色的 “链式推理” 能力。在性能方面,该模型展现出强大的编程与推理能力,在 LiveCodeBench 基准测试中,其代码生成能力紧随 OpenAI 的 o3 和 o4 mini 模型,超越了 xAI 的 Grok 3 mini 和阿里巴巴的 Qwen 3 模型,排名第四,性能几乎与 OpenAI 的 o4-mini 中等版本相当。
DeepSeek R10528 在代码生成领域表现亮眼,生成速度与准确性均有提升,无论是快速生成代码片段还是处理复杂编程任务,都展现出强大的竞争力,能够生成高质量的前端页面和交互动画,甚至一次性完成上千行代码的编写任务。同时,其在写作任务上也迎来全面升级,文本生成更加自然流畅,格式规范性显著改善,适合从学术写作到创意内容的多种场景。
此外,DeepSeek R10528 支持 128K 超大上下文窗口,为处理复杂任务提供了更广阔的空间,在 32K 上下文内的文本召回测试中表现出色,准确度显著提升,特别适合需要深度理解和精准回答的场景。而且,该模型能够针对复杂问题进行长达 30 至 60 分钟的深度推理,展现出 “思虑深远” 的特性。DeepSeek R10528 在 Hugging Face 平台开源,采用 MIT 许可证,用户可通过 DeepSeek 官方网站、App 和小程序体验,API 接口和使用方式保持不变。同时,OpenRouter 平台上线其付费 API 接入服务,并推出免费版本,配备 164K token 上下文窗口,大幅降低开发者使用门槛,让更多人能够共享 AI 技术红利。
DeepSeek R10528 的发布,无疑是 AI 领域的一座里程碑。它以卓越的性能、广泛的应用场景和开放共享的姿态,为行业树立了新的标杆,引领大模型技术发展潮流,为推动 AI 技术普及与应用开辟了新道路,让我们共同期待它在未来 AI 世界中创造更多奇迹。












