DeepSeek-R2 辟谣，GPT-5 三模式上线，马斯克 Grok 4 全球限免！| AI Weekly 8.11-8.17

木易AI信息差

489人浏览 · 2025-08-17 18:42:50

木易AI信息差 · 2025-08-17 18:42:50 发布

📢本周AI快讯 | 1分钟速览🚀

1️⃣ 🚫 DeepSeek 辟谣 R2 发布 ：知情人士辟谣 8 月发布传闻，CEO 梁文锋坚持“达标才发布”原则，算力限制和技术挑战导致延期。

2️⃣ 🎯 OpenAI 为 GPT-5 增三种模式 ：新增自动、快速和思考模式，同时恢复 GPT-4o 选项，回应用户对新模型过于正式的批评。

3️⃣ 😊 GPT-5 性格大调整 ：OpenAI 让 AI 更温暖友好，推出愤世嫉俗者、机器人、倾听者和书呆子四种预设性格供付费用户选择。

4️⃣ 💰 ChatGPT Go 低价套餐上线 ：月费仅 399 卢比（约 32.7 元人民币），面向印度等价格敏感市场，功能介于免费版和 Plus 版之间。

5️⃣ 🏅 OpenAI 神秘模型斩获 IOI 金牌 ：未经专项训练的通用推理模型在国际信息学奥赛中超越 98% 参赛者，总榜第六，AI 中排名第一。

6️⃣ 💸 OpenAI 豪掷万亿美元建 AI 基建 ：奥特曼宣布将投入数万亿美元建设数据中心，正设计全新金融工具筹资，称“放手一搏”。

7️⃣ 📱 谷歌发布超轻量 Gemma 3 270M ：仅 2.7 亿参数、241MB 大小，可在手机浏览器运行，25 轮对话仅耗 0.75% 电量。

8️⃣ 🧠 Gemini 新增记忆功能 ：个人上下文功能可自动学习用户偏好，同步推出临时聊天模式保护隐私，率先向 Gemini 2.5 Pro 用户开放。

9️⃣ 📚 Claude Sonnet 4 上下文扩至 100 万 token ：容量扩大五倍，可处理整个《哈利波特》系列或 7.5 万行代码，超 20 万 token 采用更高定价。

🔟 🆓 马斯克 Grok 4 限时免费 ：xAI 最强模型向全球用户开放，每 12 小时限 5 次查询，图像转视频工具 Grok Imagine 同步免费。

01｜DeepSeek 否认 R2 8 月发布传闻，确认本月无计划

8 月 13 日，针对近期流传的“DeepSeek-R2 将于 8 月 15 日至 30 日发布”消息，接近 DeepSeek 的知情人士向多家媒体确认，该说法不实，R2 在 8 月内并无发布计划。这是 DeepSeek 今年第二次辟谣 R2 上线时间，此前 3 月 17 日的类似传闻也已被否认。

R2 的延期背后反映出多重挑战。The Information 6 月报道指出，CEO 梁文锋对 R2 当前性能仍不满意，坚持“达不到标准就不发布”的原则。

技术层面，尽管 R2 在内部测试中已有进步，但在多语言推理和编程能力上的提升仍有限，尚未实现对 R1 的全面超越。算力方面，美国 4 月升级对华 AI 芯片出口管制，将英伟达 H20 列入限制清单，直接影响了 DeepSeek 的训练与部署进度。

同时，DeepSeek 还面临用户流失压力 —— QuestMobile 数据显示，其二季度月均下载量同比下降 72.2%，8 月 11 日晚更出现大规模宕机。在国内 AI 竞争加剧的背景下，R2 何时能达到发布标准，仍是未知数。

02｜OpenAI 推出 ChatGPT 重大更新：GPT-5 增三种模式，GPT-4o 回归

8 月 13 日，OpenAI CEO 山姆・奥特曼宣布对 ChatGPT 进行重大更新，以回应 GPT-5 发布后用户的强烈反馈。本次更新为 GPT-5 增加三种可选模式：自动（Auto）、快速（Fast）和思考（Thinking）。奥尔特曼表示，大多数用户将使用自动模式，该模式会智能平衡响应速度与深度；快速模式优先提供即时回答；思考模式则会花费更多时间处理推理密集型任务。

更引人关注的是，在用户的强烈要求下，GPT-4o 重新加入所有付费用户的模型选择器。此前 GPT-5 发布时，OpenAI 同时下架了包括 GPT-4o 在内的多个旧模型，引发不满。Reddit 上“GPT-5 太糟糕了”的讨论帖获得逾 2000 条评论，不少用户认为 GPT-4o 更具个性和温暖感，而 GPT-5 过于正式。奥特曼承认，公司低估了用户对旧模型的情感依赖，并承诺若未来弃用 GPT-4o，将提前充分通知。

此外，GPT-5 Thinking 模式的使用上限提升至每周 3000 条消息，上下文窗口扩大至 196,000 个 token；而 GPT-4.5 因 GPU 成本高昂，仅向 Pro 用户开放。

03｜OpenAI 调整 GPT-5 性格，让 AI 交互更加温暖友好

8 月 16 日，OpenAI 宣布正对 GPT-5 进行个性化调整，使其在交互中更温暖、更友好，以回应用户对模型过于正式的反馈。公司在 X 平台表示，虽然改动细微，但 ChatGPT 将更平易近人，用户会注意到如“好问题”“很好的开始”等真诚互动，而非空洞奉承。OpenAI 强调，内部测试显示，这些改动并未增加模型的“谄媚性”，与此前 GPT-5 保持相当水平。

这一更新反映了用户对 AI 交互体验的多样化偏好。许多用户怀念 GPT-4o 时期更具个性与幽默感的风格，认为 GPT-5 虽在编程、数学、科学等方面表现更强，但缺少亲切感。为此，OpenAI 不仅调整了默认性格，还为付费用户推出四种预设模式：愤世嫉俗者（Cynic）、机器人（Robot）、倾听者（Listener）与书呆子（Nerd），可根据场景自由切换。CEO 山姆・奥特曼承认，突然弃用旧模型是错误，公司正努力在友好性与真实性之间取得平衡。这项更新预计将在一天内向所有用户完成推送。

04｜OpenAI 推出 ChatGPT Go 低价套餐，月费 399 卢比限特定地区

8 月 13 日，OpenAI 悄然在定价页面新增 ChatGPT Go 订阅套餐，月费 399 印度卢比（约合人民币 32.7 元），仅为 ChatGPT Plus（1999 卢比/月）的五分之一。该套餐标注“仅在特定地区提供”，目前主要面向印度等价格敏感的发展中国家市场。

与免费版相比，ChatGPT Go 提供了更多对话次数与文件上传额度、更强的图像生成能力、有限的深度研究功能、更长的记忆与上下文窗口，以及扩展的高级数据分析功能。尽管功能不如 Plus 版全面，但对轻度用户与学生群体而言性价比颇高。

此举体现了 OpenAI 在不同市场采用差异化定价的策略。印度已成为其美国之外的第二大市场，CEO 山姆・奥特曼此前访问印度时曾预测，该市场的使用量可能很快超越美国。与此同时，谷歌也在探索为 Gemini 推出类似的区域性低价订阅计划，显示 AI 巨头正加速争夺新兴市场用户。

05｜OpenAI 神秘模型斩获 IOI 2025 金牌，超越 98% 参赛者位列总榜第六

8 月 12 日，据科技媒体 officechai 报道，OpenAI 的内部推理模型在 2025 年国际信息学奥林匹克竞赛（IOI）中表现出色，获得金牌，并在所有参赛 AI 中排名第一。在包含 330 名人类选手的总榜中，该模型位列第六，仅次于五名人类选手，其中三位来自中国。

OpenAI 研究员 Sheryl Hsu 透露，该模型并未为 IOI 进行专项训练，而是沿用了此前在国际数学奥林匹克竞赛（IMO）中夺金的同一通用推理模型集群。研究科学家 Noam Brown 证实，在 IMO 结束后的全面评测中，团队发现这一数学金牌模型在编程等多个领域同样表现优异，因此决定直接用于 IOI，不做任何修改。

比赛中，该系统严格遵守人类选手规则：5 小时时限、50 次提交限制，且全程离线，无法访问互联网或 RAG 技术。这一成绩较去年实现跨越式提升 —— 2024 年 OpenAI 专为 IOI 训练的 o1-ioi 仅获第 49 百分位，而今年的通用模型则一跃至第 98 百分位并摘得金牌，凸显了通用推理能力的显著进步。

06｜OpenAI 豪掷万亿美元押注 AI 基建，奥特曼称“放手一搏”

8 月 15 日，OpenAI CEO 山姆・奥特曼在旧金山的一场媒体晚宴上表示，OpenAI 预计将在“不久的将来”投入数万亿美元建设数据中心等 AI 基础设施。面对经济学家对巨额投资的质疑，奥特曼态度坚决：“你们会说这太疯狂、太鲁莽了，但我们会说：让我们放手去做吧。”这番表态彰显了 OpenAI 为保持 AI 领先地位不惜重金投入的决心。

奥特曼透露，公司正在设计一种全新的金融工具来筹集这笔史无前例的资金。尽管 OpenAI 目前年收入仅 100 亿美元，且去年亏损 50 亿美元，他依然认为这笔投资值得。他承认当下 AI 行业存在泡沫，部分初创公司估值“疯狂”且“不理性”，但坚信 AI 是“很长时间以来最重要的事情”，社会不会后悔对 AI 的大规模投资。

这一雄心勃勃的计划与今年 1 月公布的 Stargate 项目一脉相承 —— 该项目由 OpenAI、软银、甲骨文等联合发起，计划未来四年投资 5000 亿美元建设 AI 基础设施，其中首批 1000 亿美元已开始部署，首个数据中心正于德克萨斯州阿比林建设中。

07｜谷歌发布超轻量模型 Gemma 3 270M，可在手机浏览器运行

8 月 14 日，谷歌 DeepMind 推出 Gemma 家族最新成员 Gemma 3 270M，一款仅 2.7 亿参数的超轻量开源模型，下载大小仅 241MB。该模型面向端侧部署场景设计，可直接在智能手机、平板、树莓派甚至浏览器中运行，无需联网即可提供 AI 能力。谷歌工程师形容，这款模型“小到可以在烤面包机里运行”。

Gemma 3 270M 的亮点在于极致能效与灵活部署。内部测试显示，在 Pixel 9 Pro 上运行 INT4 量化版本时，25 轮对话仅耗 0.75% 电量，成为谷歌迄今最省电的 AI 模型。其词汇量达 25.6 万，其中 1.7 亿参数用于嵌入层、1 亿参数用于 Transformer 模块；在指令遵循基准 IFEval 上得分 51.2%，超越同规模其他模型。

更重要的是，开发者可在数分钟内完成模型微调，快速适配文本分类、实体提取、数据结构化等任务，实现真正的“小而精”设计理念。随着 Gemma 系列下载量突破 2 亿次，这款新模型有望加速端侧 AI 应用的普及。

08｜谷歌 Gemini 新增记忆功能与临时聊天模式，兼顾个性化与隐私

8 月 13 日，谷歌宣布为 Gemini AI 助手应用推出两项重要更新：个人上下文（Personal Context）记忆功能与临时聊天（Temporary Chat）模式。记忆功能默认开启，可自动记录并学习用户在过往对话中分享的关键信息与偏好，从而提供更个性化的回应。例如，若用户曾提到喜欢的漫画角色，当再次询问生日派对主题时，Gemini 可能会基于该角色推荐相关食物和拍照道具，无需重复提供背景信息。

为平衡个性化与隐私，谷歌同步推出临时聊天模式，类似浏览器的无痕模式。在该模式下，对话内容不会保存至聊天历史，也不会用于个性化或模型训练，仅保留 72 小时用于处理会话与反馈，随后即删除，为探讨敏感话题或一次性咨询提供隐私保障。

此外，谷歌将“Gemini Apps Activity”设置更名为更直观的“Keep Activity”，让用户更清楚地管理数据使用。该功能已率先向 Gemini 2.5 Pro 用户开放，后续将扩展至 2.5 Flash 模型及更多国家和地区。

09｜Claude Sonnet 4 上下文窗口扩展至 100 万 token

8 月 12 日，Anthropic 宣布将 Claude Sonnet 4 的上下文窗口容量从 20 万 token 提升至 100 万 token，扩大五倍。升级后，该模型可一次处理约 75 万个单词的内容，相当于整个《哈利波特》系列或逾 7.5 万行代码，也能同时分析数十篇长篇研究论文。

这一扩展为开发者与研究人员打开了全新应用空间：

大规模代码分析：可理解完整项目架构，识别跨文件依赖关系，并提出系统级改进建议。
文档综合处理：能同时处理大量法律合同、研究论文或技术规范，并保持对文档间关系的整体理解。
AI 智能体场景：即使经历数百次工具调用和多步骤工作流程，也能保持上下文连贯性。

需要注意的是，超过 20 万 token 的提示将采用更高定价 —— 输入价格由每百万 token 3 美元上涨至 6 美元，输出价格由 15 美元上涨至 22.5 美元。该功能现处于公开测试阶段，已通过 Anthropic API 和 Amazon Bedrock 向 Tier 4 及定制速率限制客户开放，Google Cloud Vertex AI 支持即将上线。

10｜马斯克旗下最强模型 Grok 4 限时免费，挑战 OpenAI 霸主地位

8 月 11 日，马斯克旗下 xAI 宣布其最新旗舰模型 Grok 4 面向全球用户限时免费开放，时机正值 OpenAI GPT-5 发布后遭遇大规模用户批评之际。免费用户可通过自动模式由系统智能分配查询至 Grok 4，或在“专家模式”中直接调用该模型（每 12 小时限 5 次查询）。xAI 表示，目前正提供“慷慨的使用限制”以便用户充分体验其号称“博士级水平”的能力，此优惠为临时性策略，旨在吸引更多用户试用。

这一举措被视为马斯克对 OpenAI 的正面挑战。就在数日前，GPT-5 因技术故障与体验问题遭遇严重反弹，预测市场 Polymarket 上 OpenAI 拥有最佳模型的概率在一小时内从 75% 暴跌至 14%。相比之下，Grok 4 在多项基准测试中表现出色，包括数学推理与代码生成，并凭借“追求真相”及较少内容审查的特点赢得关注。付费订阅用户可选择每月 30 美元的 SuperGrok 或每月 300 美元的 SuperGrok Heavy，后者可使用更强大的 Grok 4 Heavy 版本。

此外，xAI 宣布其图像转视频工具 Grok Imagine 也向美国用户免费开放，该工具在上线首日即生成逾 4400 万张图像。分析人士认为，这一系列动作不仅旨在抢占 AI 市场份额，也反映出行业竞争的白热化。随着 Grok 4 深度整合进 X 平台，并接入特斯拉车载系统，马斯克正打造跨平台 AI 生态，直接对标 OpenAI、谷歌与 Anthropic。

我是木易，一个专注AI领域的技术产品经理，国内Top2本科+美国Top10 CS硕士。

相信AI是普通人的“外挂”，致力于分享AI全维度知识。这里有最新的AI科普、工具测评、效率秘籍与行业洞察。

欢迎关注“AI信息Gap”，用AI为你的未来加速。

精选推荐

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

验证 .NET 4.6 的 SIMD 硬件加速支持的重要性

2048 AI社区

详解SPFA算法-单源最短路径求解

2048 AI社区

智能法务AI平台架构的未来：从辅助到主导的进化之路

2023年11月，某顶级律所的资深合伙人李律师经历了职业生涯的"认知颠覆时刻"。他通宵审阅的一份跨境并购协议，被律所新部署的AI系统在2小时内完成了全量审查——不仅标出了17处潜在法律风险（比他手动发现的多5处），还自动生成了3套风险缓释方案，其中一套结合最新判例提出的"管辖权冲突前置仲裁条款"，连他都不得不承认"超越了常规经验"。这个场景正在全球法律行业加速上演。根据Gartner 2024年报