在这里插入图片描述

0. 先把结论放在前面

2025 DeepSeek R1 (详细分析参考文章《深入解析 DeepSeek R1:强化学习如何驱动大模型推理能力的进化》)的出现真实引起了轰动。

那么,如果你最近一直在等 DeepSeek R2:截至目前,DeepSeek 官方 API 的主力模型仍是 V3.2(deepseek-chat / deepseek-reasoner),官方 News 列表里没有 R2 的“发布公告”。([DeepSeek API Docs][1])

但这不意味着“没东西可用”——R1 体系在 2025 年已经完成一次关键升级:DeepSeek-R1-0528。官方明确给出:基准更强、前端能力增强、幻觉更少,并且支持 JSON Output & Function Calling。([DeepSeek API Docs][2])

换句话说:R2 没到,但你的推理工程可以先升级一代。


1. 最新进展时间线(把信息噪声一次清掉)

时间 事件 你需要知道的“工程含义”
2025/01/20 DeepSeek-R1 正式发布(MIT,支持蒸馏/商用) 推理模型范式确立:RL 后训练 + 冷启动数据 + 可蒸馏。([DeepSeek API Docs][3])
2025/05/28 DeepSeek-R1-0528 发布 “可用性升级”:更强基准、更少幻觉、支持 JSON/函数调用。([DeepSeek API Docs][2])
2025/12/01 DeepSeek-V3.2 & V3.2-Speciale 发布 面向 Agent:思考与工具使用融合;API/网页端主力更新。([DeepSeek API Docs][4])
R2(传闻多、发布日期未定) 路线明确但发布时间不确定 多家媒体称其经历性能/算力/芯片约束导致延迟。([Reuters][5])

关键事实:DeepSeek API Docs 的 Models & Pricing 页面显示当前模型版本为 DeepSeek-V3.2(deepseek-chat / deepseek-reasoner)。([DeepSeek API Docs][1])


2. R1-0528 到底升级了什么(不讲虚的)

官方公告给的升级点非常“工程化”:

  • Improved benchmark performance
  • Enhanced front-end capabilities
  • Reduced hallucinations
  • Supports JSON output & function calling ([DeepSeek API Docs][2])

而 Hugging Face 的模型卡也强调:通过“更多计算资源 + 后训练算法优化”,提升推理深度与推断能力。([Hugging Face][6])

你最该关心的两个点:

(1)JSON / Function Calling:从“会答题”走向“可接系统”
这意味着你可以把 R1-0528 放进真实业务:路由、工具调用、结构化出参、评测脚本自动解析。([DeepSeek API Docs][2])

(2)更少幻觉:从“能演示”走向“能上线”
幻觉下降不等于“不会错”,但意味着你做 RAG / 工具调用 / 多步推理时,防线压力更小。([DeepSeek API Docs][2])


3. 用数据说话:R1-0528 在 LiveCodeBench 的位置

LiveCodeBench Leaderboard 上可以直接看到 DeepSeek-R1-0528 的分数与排名(页面可查)。([LiveCodeBench][7])
这类榜单至少告诉你一件事:R1-0528 是“在代码推理场景能打”的版本,不是“换皮小修”。


4. 那 R2 呢?到底进展到哪一步了

你会在网上看到各种“R2 已发布/将发布/静默上线”的说法,但可靠口径更克制:

  • 早期有报道提到 DeepSeek 试图加速 R2(原计划 2025/05 前后)。([Reuters][8])
  • 随后 Reuters 报道:R2 发布时间未定,原因之一是 CEO 对表现不满意(外媒转述 The Information)。([Reuters][5])
  • 又有 Reuters/FT 线索称:尝试使用华为芯片训练遇到问题,导致延期。([Reuters][9])
  • TechNode 也报道过“否认 8 月窗口传闻”,且至今未公布官方发布日期与技术细节。([TechNode][10])

因此,正确动作不是“等 R2”,而是:把你现有推理栈升级到 R1-0528 / V3.2,并把接口与评测体系先搭好。


5. 一句话给工程同学的选型建议

  • 你做“任务执行/工具调用/结构化输出”:优先围绕 JSON Output + Function Calling 设计出参契约(R1-0528 已支持)。([DeepSeek API Docs][2])
  • 你做“Agent 工作流”:关注 V3.2 的 tool-use 与 thinking 融合(官方明确面向 agents)。([DeepSeek API Docs][4])
  • 你做“本地部署/省钱推理”:可以关注社区与厂商对 R1-0528 的量化版本(例如 NVIDIA 的 FP4 量化卡)。([Hugging Face][11])

6. 推理栈结构(给你一张可贴在文章里的 Mermaid)

需求/任务

是否需要多步推理?

deepseek-chat 非思考模式

deepseek-reasoner 思考模式

是否需要工具/函数调用?

JSON Output + Function Calling

纯推理输出

工具执行/检索/代码运行

校验: 结构+约束+单测

日志+评测+回归


如果你希望进步深入理解R1/R1-0528 的 GRPO/RL 后训练工程拆解(怎么做小规模复现)请转到我的付费文章《DeepSeek R1-0528 工程落地手册:从推理训练到 Agent 接口(附模板/清单/示例)》

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐