DeepSeek R2 还没来,但 R1 已经升级到 R1-0528:推理栈要怎么跟?
摘要: DeepSeek R2 尚未发布,但 R1 已升级至 R1-0528,支持 JSON 输出、函数调用,并优化了基准性能与幻觉问题。当前 API 主力模型仍为 V3.2,但 R1-0528 更适合结构化任务与工具调用场景。R2 因性能与芯片问题延迟,建议优先升级推理栈至 R1-0528 或 V3.2,并适配接口与评测体系。工程选型需结合需求:任务执行选 JSON/函数调用,Agent 工作流

DeepSeek R2 还没来,但 R1 已经升级到 R1-0528:推理栈要怎么跟?
0. 先把结论放在前面
2025 DeepSeek R1 (详细分析参考文章《深入解析 DeepSeek R1:强化学习如何驱动大模型推理能力的进化》)的出现真实引起了轰动。
那么,如果你最近一直在等 DeepSeek R2:截至目前,DeepSeek 官方 API 的主力模型仍是 V3.2(deepseek-chat / deepseek-reasoner),官方 News 列表里没有 R2 的“发布公告”。([DeepSeek API Docs][1])
但这不意味着“没东西可用”——R1 体系在 2025 年已经完成一次关键升级:DeepSeek-R1-0528。官方明确给出:基准更强、前端能力增强、幻觉更少,并且支持 JSON Output & Function Calling。([DeepSeek API Docs][2])
换句话说:R2 没到,但你的推理工程可以先升级一代。
1. 最新进展时间线(把信息噪声一次清掉)
| 时间 | 事件 | 你需要知道的“工程含义” |
|---|---|---|
| 2025/01/20 | DeepSeek-R1 正式发布(MIT,支持蒸馏/商用) | 推理模型范式确立:RL 后训练 + 冷启动数据 + 可蒸馏。([DeepSeek API Docs][3]) |
| 2025/05/28 | DeepSeek-R1-0528 发布 | “可用性升级”:更强基准、更少幻觉、支持 JSON/函数调用。([DeepSeek API Docs][2]) |
| 2025/12/01 | DeepSeek-V3.2 & V3.2-Speciale 发布 | 面向 Agent:思考与工具使用融合;API/网页端主力更新。([DeepSeek API Docs][4]) |
| R2(传闻多、发布日期未定) | 路线明确但发布时间不确定 | 多家媒体称其经历性能/算力/芯片约束导致延迟。([Reuters][5]) |
关键事实:DeepSeek API Docs 的 Models & Pricing 页面显示当前模型版本为 DeepSeek-V3.2(deepseek-chat / deepseek-reasoner)。([DeepSeek API Docs][1])
2. R1-0528 到底升级了什么(不讲虚的)
官方公告给的升级点非常“工程化”:
- Improved benchmark performance
- Enhanced front-end capabilities
- Reduced hallucinations
- Supports JSON output & function calling ([DeepSeek API Docs][2])
而 Hugging Face 的模型卡也强调:通过“更多计算资源 + 后训练算法优化”,提升推理深度与推断能力。([Hugging Face][6])
你最该关心的两个点:
(1)JSON / Function Calling:从“会答题”走向“可接系统”
这意味着你可以把 R1-0528 放进真实业务:路由、工具调用、结构化出参、评测脚本自动解析。([DeepSeek API Docs][2])
(2)更少幻觉:从“能演示”走向“能上线”
幻觉下降不等于“不会错”,但意味着你做 RAG / 工具调用 / 多步推理时,防线压力更小。([DeepSeek API Docs][2])
3. 用数据说话:R1-0528 在 LiveCodeBench 的位置
LiveCodeBench Leaderboard 上可以直接看到 DeepSeek-R1-0528 的分数与排名(页面可查)。([LiveCodeBench][7])
这类榜单至少告诉你一件事:R1-0528 是“在代码推理场景能打”的版本,不是“换皮小修”。
4. 那 R2 呢?到底进展到哪一步了
你会在网上看到各种“R2 已发布/将发布/静默上线”的说法,但可靠口径更克制:
- 早期有报道提到 DeepSeek 试图加速 R2(原计划 2025/05 前后)。([Reuters][8])
- 随后 Reuters 报道:R2 发布时间未定,原因之一是 CEO 对表现不满意(外媒转述 The Information)。([Reuters][5])
- 又有 Reuters/FT 线索称:尝试使用华为芯片训练遇到问题,导致延期。([Reuters][9])
- TechNode 也报道过“否认 8 月窗口传闻”,且至今未公布官方发布日期与技术细节。([TechNode][10])
因此,正确动作不是“等 R2”,而是:把你现有推理栈升级到 R1-0528 / V3.2,并把接口与评测体系先搭好。
5. 一句话给工程同学的选型建议
- 你做“任务执行/工具调用/结构化输出”:优先围绕 JSON Output + Function Calling 设计出参契约(R1-0528 已支持)。([DeepSeek API Docs][2])
- 你做“Agent 工作流”:关注 V3.2 的 tool-use 与 thinking 融合(官方明确面向 agents)。([DeepSeek API Docs][4])
- 你做“本地部署/省钱推理”:可以关注社区与厂商对 R1-0528 的量化版本(例如 NVIDIA 的 FP4 量化卡)。([Hugging Face][11])
6. 推理栈结构(给你一张可贴在文章里的 Mermaid)
如果你希望进步深入理解R1/R1-0528 的 GRPO/RL 后训练工程拆解(怎么做小规模复现)请转到我的付费文章《DeepSeek R1-0528 工程落地手册:从推理训练到 Agent 接口(附模板/清单/示例)》
更多推荐



所有评论(0)