DeepSeek-R2 辟谣,GPT-5 三模式上线,马斯克 Grok 4 全球限免!| AI Weekly 8.11-8.17
DeepSeek-R2 辟谣,GPT-5 三模式上线,马斯克 Grok 4 全球限免!| AI Weekly 8.11-8.17
📢本周AI快讯 | 1分钟速览🚀
1️⃣ 🚫 DeepSeek 辟谣 R2 发布 :知情人士辟谣 8 月发布传闻,CEO 梁文锋坚持“达标才发布”原则,算力限制和技术挑战导致延期。
2️⃣ 🎯 OpenAI 为 GPT-5 增三种模式 :新增自动、快速和思考模式,同时恢复 GPT-4o
选项,回应用户对新模型过于正式的批评。
3️⃣ 😊 GPT-5 性格大调整 :OpenAI 让 AI 更温暖友好,推出愤世嫉俗者、机器人、倾听者和书呆子四种预设性格供付费用户选择。
4️⃣ 💰 ChatGPT Go 低价套餐上线 :月费仅 399 卢比(约 32.7 元人民币),面向印度等价格敏感市场,功能介于免费版和 Plus 版之间。
5️⃣ 🏅 OpenAI 神秘模型斩获 IOI 金牌 :未经专项训练的通用推理模型在国际信息学奥赛中超越 98% 参赛者,总榜第六,AI 中排名第一。
6️⃣ 💸 OpenAI 豪掷万亿美元建 AI 基建 :奥特曼宣布将投入数万亿美元建设数据中心,正设计全新金融工具筹资,称“放手一搏”。
7️⃣ 📱 谷歌发布超轻量 Gemma 3 270M :仅 2.7 亿参数、241MB 大小,可在手机浏览器运行,25 轮对话仅耗 0.75% 电量。
8️⃣ 🧠 Gemini 新增记忆功能 :个人上下文功能可自动学习用户偏好,同步推出临时聊天模式保护隐私,率先向 Gemini 2.5 Pro
用户开放。
9️⃣ 📚 Claude Sonnet 4 上下文扩至 100 万 token :容量扩大五倍,可处理整个《哈利波特》系列或 7.5 万行代码,超 20 万 token 采用更高定价。
🔟 🆓 马斯克 Grok 4 限时免费 :xAI 最强模型向全球用户开放,每 12 小时限 5 次查询,图像转视频工具 Grok Imagine 同步免费。
01|DeepSeek 否认 R2 8 月发布传闻,确认本月无计划
8 月 13 日,针对近期流传的“DeepSeek-R2
将于 8 月 15 日至 30 日发布”消息,接近 DeepSeek 的知情人士向多家媒体确认,该说法不实,R2
在 8 月内并无发布计划。这是 DeepSeek 今年第二次辟谣 R2
上线时间,此前 3 月 17 日的类似传闻也已被否认。
R2
的延期背后反映出多重挑战。The Information 6 月报道指出,CEO 梁文锋对 R2
当前性能仍不满意,坚持“达不到标准就不发布”的原则。
技术层面,尽管 R2
在内部测试中已有进步,但在多语言推理和编程能力上的提升仍有限,尚未实现对 R1
的全面超越。算力方面,美国 4 月升级对华 AI 芯片出口管制,将英伟达 H20 列入限制清单,直接影响了 DeepSeek 的训练与部署进度。
同时,DeepSeek 还面临用户流失压力 —— QuestMobile 数据显示,其二季度月均下载量同比下降 72.2%,8 月 11 日晚更出现大规模宕机。在国内 AI 竞争加剧的背景下,R2
何时能达到发布标准,仍是未知数。
02|OpenAI 推出 ChatGPT 重大更新:GPT-5 增三种模式,GPT-4o 回归
8 月 13 日,OpenAI CEO 山姆・奥特曼宣布对 ChatGPT 进行重大更新,以回应 GPT-5
发布后用户的强烈反馈。本次更新为 GPT-5
增加三种可选模式:自动(Auto)、快速(Fast)和思考(Thinking)。奥尔特曼表示,大多数用户将使用自动模式,该模式会智能平衡响应速度与深度;快速模式优先提供即时回答;思考模式则会花费更多时间处理推理密集型任务。
更引人关注的是,在用户的强烈要求下,GPT-4o
重新加入所有付费用户的模型选择器。此前 GPT-5
发布时,OpenAI 同时下架了包括 GPT-4o
在内的多个旧模型,引发不满。Reddit 上“GPT-5 太糟糕了”的讨论帖获得逾 2000 条评论,不少用户认为 GPT-4o
更具个性和温暖感,而 GPT-5
过于正式。奥特曼承认,公司低估了用户对旧模型的情感依赖,并承诺若未来弃用 GPT-4o
,将提前充分通知。
此外,GPT-5 Thinking
模式的使用上限提升至每周 3000 条消息,上下文窗口扩大至 196,000 个 token;而 GPT-4.5
因 GPU 成本高昂,仅向 Pro 用户开放。
03|OpenAI 调整 GPT-5 性格,让 AI 交互更加温暖友好
8 月 16 日,OpenAI 宣布正对 GPT-5
进行个性化调整,使其在交互中更温暖、更友好,以回应用户对模型过于正式的反馈。公司在 X 平台表示,虽然改动细微,但 ChatGPT 将更平易近人,用户会注意到如“好问题”“很好的开始”等真诚互动,而非空洞奉承。OpenAI 强调,内部测试显示,这些改动并未增加模型的“谄媚性”,与此前 GPT-5
保持相当水平。
这一更新反映了用户对 AI 交互体验的多样化偏好。许多用户怀念 GPT-4o
时期更具个性与幽默感的风格,认为 GPT-5
虽在编程、数学、科学等方面表现更强,但缺少亲切感。为此,OpenAI 不仅调整了默认性格,还为付费用户推出四种预设模式:愤世嫉俗者(Cynic)、机器人(Robot)、倾听者(Listener)与书呆子(Nerd),可根据场景自由切换。CEO 山姆・奥特曼承认,突然弃用旧模型是错误,公司正努力在友好性与真实性之间取得平衡。这项更新预计将在一天内向所有用户完成推送。
04|OpenAI 推出 ChatGPT Go 低价套餐,月费 399 卢比限特定地区
8 月 13 日,OpenAI 悄然在定价页面新增 ChatGPT Go
订阅套餐,月费 399 印度卢比(约合人民币 32.7 元),仅为 ChatGPT Plus(1999 卢比/月)的五分之一。该套餐标注“仅在特定地区提供”,目前主要面向印度等价格敏感的发展中国家市场。
与免费版相比,ChatGPT Go
提供了更多对话次数与文件上传额度、更强的图像生成能力、有限的深度研究功能、更长的记忆与上下文窗口,以及扩展的高级数据分析功能。尽管功能不如 Plus 版全面,但对轻度用户与学生群体而言性价比颇高。
此举体现了 OpenAI 在不同市场采用差异化定价的策略。印度已成为其美国之外的第二大市场,CEO 山姆・奥特曼此前访问印度时曾预测,该市场的使用量可能很快超越美国。与此同时,谷歌也在探索为 Gemini
推出类似的区域性低价订阅计划,显示 AI 巨头正加速争夺新兴市场用户。
05|OpenAI 神秘模型斩获 IOI 2025 金牌,超越 98% 参赛者位列总榜第六
8 月 12 日,据科技媒体 officechai 报道,OpenAI 的内部推理模型在 2025 年国际信息学奥林匹克竞赛(IOI)中表现出色,获得金牌,并在所有参赛 AI 中排名第一。在包含 330 名人类选手的总榜中,该模型位列第六,仅次于五名人类选手,其中三位来自中国。
OpenAI 研究员 Sheryl Hsu 透露,该模型并未为 IOI 进行专项训练,而是沿用了此前在国际数学奥林匹克竞赛(IMO)中夺金的同一通用推理模型集群。研究科学家 Noam Brown 证实,在 IMO 结束后的全面评测中,团队发现这一数学金牌模型在编程等多个领域同样表现优异,因此决定直接用于 IOI,不做任何修改。
比赛中,该系统严格遵守人类选手规则:5 小时时限、50 次提交限制,且全程离线,无法访问互联网或 RAG 技术。这一成绩较去年实现跨越式提升 —— 2024 年 OpenAI 专为 IOI 训练的 o1-ioi
仅获第 49 百分位,而今年的通用模型则一跃至第 98 百分位并摘得金牌,凸显了通用推理能力的显著进步。
06|OpenAI 豪掷万亿美元押注 AI 基建,奥特曼称“放手一搏”
8 月 15 日,OpenAI CEO 山姆・奥特曼在旧金山的一场媒体晚宴上表示,OpenAI 预计将在“不久的将来”投入数万亿美元建设数据中心等 AI 基础设施。面对经济学家对巨额投资的质疑,奥特曼态度坚决:“你们会说这太疯狂、太鲁莽了,但我们会说:让我们放手去做吧。”这番表态彰显了 OpenAI 为保持 AI 领先地位不惜重金投入的决心。
奥特曼透露,公司正在设计一种全新的金融工具来筹集这笔史无前例的资金。尽管 OpenAI 目前年收入仅 100 亿美元,且去年亏损 50 亿美元,他依然认为这笔投资值得。他承认当下 AI 行业存在泡沫,部分初创公司估值“疯狂”且“不理性”,但坚信 AI 是“很长时间以来最重要的事情”,社会不会后悔对 AI 的大规模投资。
这一雄心勃勃的计划与今年 1 月公布的 Stargate 项目一脉相承 —— 该项目由 OpenAI、软银、甲骨文等联合发起,计划未来四年投资 5000 亿美元建设 AI 基础设施,其中首批 1000 亿美元已开始部署,首个数据中心正于德克萨斯州阿比林建设中。
07|谷歌发布超轻量模型 Gemma 3 270M,可在手机浏览器运行
8 月 14 日,谷歌 DeepMind 推出 Gemma
家族最新成员 Gemma 3 270M
,一款仅 2.7 亿参数的超轻量开源模型,下载大小仅 241MB。该模型面向端侧部署场景设计,可直接在智能手机、平板、树莓派甚至浏览器中运行,无需联网即可提供 AI 能力。谷歌工程师形容,这款模型“小到可以在烤面包机里运行”。
Gemma 3 270M
的亮点在于极致能效与灵活部署。内部测试显示,在 Pixel 9 Pro 上运行 INT4 量化版本时,25 轮对话仅耗 0.75% 电量,成为谷歌迄今最省电的 AI 模型。其词汇量达 25.6 万,其中 1.7 亿参数用于嵌入层、1 亿参数用于 Transformer 模块;在指令遵循基准 IFEval 上得分 51.2%,超越同规模其他模型。
更重要的是,开发者可在数分钟内完成模型微调,快速适配文本分类、实体提取、数据结构化等任务,实现真正的“小而精”设计理念。随着 Gemma
系列下载量突破 2 亿次,这款新模型有望加速端侧 AI 应用的普及。
08|谷歌 Gemini 新增记忆功能与临时聊天模式,兼顾个性化与隐私
8 月 13 日,谷歌宣布为 Gemini
AI 助手应用推出两项重要更新:个人上下文(Personal Context)记忆功能与临时聊天(Temporary Chat)模式。记忆功能默认开启,可自动记录并学习用户在过往对话中分享的关键信息与偏好,从而提供更个性化的回应。例如,若用户曾提到喜欢的漫画角色,当再次询问生日派对主题时,Gemini
可能会基于该角色推荐相关食物和拍照道具,无需重复提供背景信息。
为平衡个性化与隐私,谷歌同步推出临时聊天模式,类似浏览器的无痕模式。在该模式下,对话内容不会保存至聊天历史,也不会用于个性化或模型训练,仅保留 72 小时用于处理会话与反馈,随后即删除,为探讨敏感话题或一次性咨询提供隐私保障。
此外,谷歌将“Gemini Apps Activity”设置更名为更直观的“Keep Activity”,让用户更清楚地管理数据使用。该功能已率先向 Gemini 2.5 Pro
用户开放,后续将扩展至 2.5 Flash
模型及更多国家和地区。
09|Claude Sonnet 4 上下文窗口扩展至 100 万 token
8 月 12 日,Anthropic 宣布将 Claude Sonnet 4
的上下文窗口容量从 20 万 token 提升至 100 万 token,扩大五倍。升级后,该模型可一次处理约 75 万个单词的内容,相当于整个《哈利波特》系列或逾 7.5 万行代码,也能同时分析数十篇长篇研究论文。
这一扩展为开发者与研究人员打开了全新应用空间:
-
大规模代码分析:可理解完整项目架构,识别跨文件依赖关系,并提出系统级改进建议。
-
文档综合处理:能同时处理大量法律合同、研究论文或技术规范,并保持对文档间关系的整体理解。
-
AI 智能体场景:即使经历数百次工具调用和多步骤工作流程,也能保持上下文连贯性。
需要注意的是,超过 20 万 token 的提示将采用更高定价 —— 输入价格由每百万 token 3 美元上涨至 6 美元,输出价格由 15 美元上涨至 22.5 美元。该功能现处于公开测试阶段,已通过 Anthropic API 和 Amazon Bedrock 向 Tier 4 及定制速率限制客户开放,Google Cloud Vertex AI 支持即将上线。
10|马斯克旗下最强模型 Grok 4 限时免费,挑战 OpenAI 霸主地位
8 月 11 日,马斯克旗下 xAI 宣布其最新旗舰模型 Grok 4
面向全球用户限时免费开放,时机正值 OpenAI GPT-5
发布后遭遇大规模用户批评之际。免费用户可通过自动模式由系统智能分配查询至 Grok 4
,或在“专家模式”中直接调用该模型(每 12 小时限 5 次查询)。xAI 表示,目前正提供“慷慨的使用限制”以便用户充分体验其号称“博士级水平”的能力,此优惠为临时性策略,旨在吸引更多用户试用。
这一举措被视为马斯克对 OpenAI 的正面挑战。就在数日前,GPT-5
因技术故障与体验问题遭遇严重反弹,预测市场 Polymarket 上 OpenAI 拥有最佳模型的概率在一小时内从 75% 暴跌至 14%。相比之下,Grok 4
在多项基准测试中表现出色,包括数学推理与代码生成,并凭借“追求真相”及较少内容审查的特点赢得关注。付费订阅用户可选择每月 30 美元的 SuperGrok 或每月 300 美元的 SuperGrok Heavy,后者可使用更强大的 Grok 4 Heavy
版本。
此外,xAI 宣布其图像转视频工具 Grok Imagine 也向美国用户免费开放,该工具在上线首日即生成逾 4400 万张图像。分析人士认为,这一系列动作不仅旨在抢占 AI 市场份额,也反映出行业竞争的白热化。随着 Grok 4
深度整合进 X 平台,并接入特斯拉车载系统,马斯克正打造跨平台 AI 生态,直接对标 OpenAI、谷歌与 Anthropic。
我是木易,一个专注AI领域的技术产品经理,国内Top2本科+美国Top10 CS硕士。
相信AI是普通人的“外挂”,致力于分享AI全维度知识。这里有最新的AI科普、工具测评、效率秘籍与行业洞察。
欢迎关注“AI信息Gap”,用AI为你的未来加速。
精选推荐
更多推荐
所有评论(0)