GMI Cloud@AI 周报 | Gemini 3、Nano Banana Pro轮番炸场;Grok4.1低调发布;蚂蚁灵光阿里千问接踵而至
本周 AI 圈有哪些新闻?
关键词:Gemini 3 ;Grok 4.1 ;蚂蚁灵光;
Giants
巴菲特重金入股谷歌;Meta 员工 AI 使用情况直接挂钩 KPI
苹果 CEO 库克被曝最早明年让位,内部称苹果 AI 已落后同行 2 年
金融时报最新爆料,苹果现任 CEO 库克最早将于明年退休,接棒人选为现任硬件工程高级副总裁 John Ternus。此举反映了苹果在 AI 时代的紧迫感。据彭博社知名记者古尔曼爆料,苹果内部也认为其人工智能"落后行业领导者两年多"。从 2023 年底谷歌推出 Gemini 时苹果匆忙推出开源机器学习框架 MLX,到包含摘要、总结等功能的 Apple Intelligence 在竞品光环下失去亮点,苹果在 AI 领域的表现确实不尽如人意。iPhone Air 首销周激活量仅 5w+,不足 iPhone 17 Pro Max 的十分之一,进一步加剧了苹果的焦虑情绪。
巴菲特系 49 亿美金入股 Google
投资公司 Berkshire Hathaway 最新披露,其截至 9 月 30 日持有 Alphabet 约 17.85 万股,估计市值约达 49 亿美元。这一举动标志着长期以来被视为"避科技股"的伯克希尔投资风格出现转变,亦被市场解读为对 Alphabet 未来在 AI 与云基础设施领域布局的信心投票。谷歌母公司 Alphabet Inc。股价在盘前交易中大幅上涨约 5.5%。分析人士指出,Alphabet 的估值仍低于多家 AI 重仓科技巨头,此次巴菲特系入场或有助于重塑市场对这家科技巨头未来增长路径的预期。
Meta 革新员工绩效评估,AI 使用情况直接挂钩 KPI
Meta 在内部信函中宣布,从 2026 年起,AI 将与员工绩效挂钩。公司将评估员工使用 AI 的情况,考察他们如何通过 AI 提高自己的工作效率,以及是否构建有能够显著提升生产力的工具。Meta 还将在内部推出 AI 绩效工具 Metamate,帮助员工撰写绩效评估内容和反馈。这一举措标志着 Meta 全面拥抱 AI 的战略决心,也反映了硅谷科技公司对 AI 工具使用的重视程度不断提升。
全球首家 AI 编程创企估值破 2000 亿,英伟达和谷歌抢投
爆款 AI 编程神器 Cursor(母公司为 Anysphere)宣布完成 23 亿美元的巨额 D 轮融资,投后估值达 293 亿美元(约合人民币 2079.1 亿元),成为全球首家估值突破 2000 亿元人民币的 AI 编程创企。此轮融资的投资方阵容豪华,新增投资者包括英伟达、谷歌和顶级基金 Coatue。Cursor 的年化收入已突破 10 亿美元,数百万开发人员和许多世界上最成功的工程组织都是其客户。英伟达创始人兼 CEO 黄仁勋称,在英伟达,每一位软件工程师都在用 Cursor,Cursor 就像是大家的编程伙伴,大幅提升了生产力。
Models & Applications
Gemini 3 深夜炸场马斯克奥特曼点赞;Grok 4.1 情感交互能力展现优势;蚂蚁灵光、阿里千问 APP 上线
谷歌 Gemini 3 Pro 全面超越 GPT-5.1,马斯克奥特曼纷纷点赞
谷歌发布 Gemini 3 Pro 模型,在几乎所有基准测试中超过 GPT-5.1 和 Claude4.5,包括人类最后的考试、ARC-AGI-2 等专为 AGI 准备的测试。数学的 AIME 2025 带工具拿满分,还刷新了之前让大模型全员得 0 分的 LiveCodeBench Pro 纪录。用户投票的大模型竞技场中,马斯克的 Grok4.1 昨天才刷完榜,今天就被反超了。奥特曼和马斯克也不得不佩服,前后脚出来点赞祝贺。谷歌还推出 Google Antigravity 实验性智能体开发平台,构建"智能体优先"的开发环境,将开发者从繁琐的编码工作中解放出来。

阿里千问 app 开启公测,性能跻身全球前列
阿里巴巴正式宣布"千问"项目,全力进军 AI to C 市场。千问 APP 公测版基于全球性能第一的开源模型 Qwen3,凭借免费以及与各类生活场景生态的结合。阿里核心管理层将"千问"项目视为"AI 时代的未来之战"。Qwen 系列模型的全球下载量已突破 6 亿次,近期发布的旗舰模型 Qwen3-Max,性能超过 GPT5、Claude Opus 4 等国际竞争者,跻身全球前列。Airbnb CEO 布莱恩·切斯基公开表示,公司正"大量依赖 Qwen",因其比 OpenAI 模型更快更好。
蚂蚁灵光 App 空降,主推 30 秒生成小应用
蚂蚁集团推出全模态通用 AI 助手"灵光",支持自然语言 30 秒生成小应用,或输出 3D 数字模型、音频、图标、动画、地图等全模态信息。"灵光"App 首批上线三大功能:"灵光对话"、"灵光闪应用"、"灵光开眼",分别对应文字对话、应用生成和多模态三种玩法。该应用支持快速生成云养猫互动小应用、记账应用等实用工具,还具备视觉功能可识别气温信息并提供穿衣指南。值得注意的是,"灵光"的发布与阿里"千问"App 的发布仅仅相隔 1 天,两大巨头在 AI 超级入口的争夺战日趋激烈。
马斯克 Grok 4.1 低调发布,情感交互能力展现优势
xAI 公司毫无预兆地发布了 Grok 4.1 模型,一经发布,在 LMArena 的 Text Arena 排行榜上,Grok 4.1 的推理模式以 1483 的 Elo 分数位居总榜首位,领先最高的非 xAI 模型整整 31 分。即便是非推理模式也以 1465 Elo 分数位居第二,超越了其他所有模型在启用完整推理配置下的表现。该模型在情感智能、创意写作等方面表现突出,在 EQ-Bench3 和 Creative Writing v3 基准测试中均位居前两名。马斯克在 x 上宣传称,Grok 4.1 在真实世界可用性方面带来显著提升,尤其是在创造力、情感互动和协作交互方面表现出色。

谷歌 Gemini 3 Pro 全面超越 GPT-5.1,马斯克奥特曼纷纷点赞
谷歌发布 Gemini 3 Pro 模型,在几乎所有基准测试中超过 GPT-5.1 和 Claude4.5,包括人类最后的考试、ARC-AGI-2 等专为 AGI 准备的测试。数学的 AIME 2025 带工具拿满分,还刷新了之前让大模型全员得 0 分的 LiveCodeBench Pro 纪录。用户投票的大模型竞技场中,马斯克的 Grok4.1 昨天才刷完榜,今天就被反超了。奥特曼和马斯克也不得不佩服,前后脚出来点赞祝贺。谷歌还推出 Google Antigravity 实验性智能体开发平台,构建"智能体优先"的开发环境,将开发者从繁琐的编码工作中解放出来。
字节跳动 InfinityStar 视频生成技术突破,单 GPU 一分钟生成 5 秒 720p 视频
字节跳动商业化技术团队发布入围 NeurIPS'25 Oral 的论文,提出 InfinityStar 方法,一举兼得视频生成的质量和效率。该技术采用时空金字塔建模,是首个在 VBench 上超越扩散模型的离散自回归视频生成器。核心架构将视频分解为"首帧+后续片段",通过时空自回归 Transformer 建模,实现从百步去噪到自回归的转变。InfinityStar 在单张 GPU 上生成一个 5s 720p 的视频仅需不到 1 分钟,比同尺寸的基于 DiT 的方法快一个数量级。该技术现已通过 Discord 社区向公众开放体验。
ChatGPT 破折号问题被修复,奥特曼亲自官宣
OpenAI CEO 奥特曼亲自宣布,ChatGPT 可以听从指示,在输出内容中不再滥用破折号。在此之前,ChatGPT 对破折号的"痴迷"早已让用户不胜其烦,成为人们判断 AI 生成内容的标志。GitHub 软件工程师 Sean Goedecke 的研究发现,AI 对破折号的偏爱极有可能来自于 RLHF 信息提供者的语言习惯,以及 19 世纪出版物的引入。GPT 从 GPT-4 开始,破折号使用频率比之前增长了十倍,而这段时间刚好是破折号的使用高峰。
谷歌 DeepMind WeatherNext 2 革命性天气预测,32 个随机数字推演地球未来 15 天
谷歌 DeepMind 发布 WeatherNext 2,让查天气升级成小时级、实时化。运行速度比上一代快 8 倍,分辨率提高到小时级,可以细到"明天 2–3 点有小雨,3–4 点雨势增强"的节奏。关键创新是 FGN(Functional Generations Networks)功能生成网络,通过给模型本体加上轻微但全局一致的随机扰动,让模型变成一个会变化的小地球。输入 32 个随机数字就能生成高达 8700 万维的全球天气变化,99.9%的预测变量和时效都超过了上一代。在 1 个 TPU 上,生成一次 15 天的全球预报只需要不到 1 分钟。

中国医疗 AI 未来医生工作室全球第一,众多医生已用于诊断
在由 32 位国内顶尖临床专家组织的"多模型临床实战测评"中,未来医生 AI 工作室的核心模型 MedGPT,以明显优势击败 OpenAI-o3、DeepSeek-R1、Gemini-2.5-Pro、Claude-3.7-Sonnet、Qwen3-235B 等国际最前沿的知名大模型,夺得临床"安全"与"有效性"评测的全球第一。该工作室提供诊中临床决策 AI 助手和诊后患者随访 AI 助手,被数十位全国学科主委纳入日常使用。安全性得分比全部模型平均水平高出近 70%,在儿童、孕产妇、老年人等复杂人群场景中也很稳健。
微博 VibeThinker 小模型大突破,7800 美元训练成本超越 DeepSeek-R1
微博发布首个自研开源大模型 VibeThinker,仅拥有 15 亿参数,但在国际顶级数学竞赛基准测试上击败了参数量高达 6710 亿的 DeepSeek R1 模型。更令人瞩目的是,其单次"后训练"的成本仅 7800 美元,对比 DeepSeek-R1 和 MiniMax-M1 等成本直接降低了几十倍。该模型在 AIME24、AIME25 以及 HMMT25 三个高难度数学测试集上的表现超越了 DeepSeek-R1-0120 版本,与规模为 456B 的 MiniMax-M1 效果接近或相当。微博计划将 VibeThinker 应用于微博智搜等核心 AI 产品中。
全球AI政策与市场简讯
神秘 AI 创企 Project Prometheus 获 62 亿美元融资,贝索斯首次正式担任 CEO
美国神秘 AI 创企 Project Prometheus 获得 62 亿美元(折合人民币约 441 亿元)融资,亚马逊创始人杰夫·贝索斯不仅是新融资部分金额的出资者,还将作为联合 CEO 协助管理该公司。这是贝索斯自 2021 年 7 月卸任亚马逊 CEO 以来,首次正式担任公司运营职务。Project Prometheus 非常神秘,成立时间、成立地点现在一概没有公开,且没有公司官网。其业务将专注于 AI 在计算机、航空航天和汽车等多个领域的应用。知情人士透露,Project Prometheus 已经雇用了近 100 名员工,包括从 OpenAI、谷歌 DeepMind 和 Meta 等顶级 AI 公司挖来的研究人员。
以上所有信息源自网络
THE END
关于 GMI Cloud
由 Google X 的 AI 专家与硅谷精英共同参与创立的 GMI Cloud 是一家领先的 AI Native Cloud 服务商,是全球六大 Reference Platform NVIDIA Cloud Partner 之一,拥有遍布全球的数据中心,为企业 AI 应用提供最新、最优的 GPU 云服务,为全球新创公司、研究机构和大型企业提供稳定安全、高效经济的 AI 云服务解决方案。
GMI Cloud 凭借高稳定性的技术架构、强大的GPU供应链以及令人瞩目的 GPU 产品阵容(如能够精准平衡 AI 成本与效率的 H200、具有卓越性能的 GB200、GB300 以及未来所有全新上线的高性能芯片),确保企业客户在高度数据安全与计算效能的基础上,高效低本地完成 AI 落地。此外,通过自研“Cluster Engine”、“Inference Engine”两大平台,完成从算力原子化供给到业务级智算服务的全栈跃迁,全力构建下一代智能算力基座。
作为推动通用人工智能(AGI)未来发展的重要力量,GMI Cloud 持续在 AI 基础设施领域引领创新。选择 GMI Cloud,您不仅是选择了先进的 GPU 云服务,更是选择了一个全方位的 AI 基础设施合作伙伴。
如果您想要了解有关 GMI Cloud 的信息
请关注我们并建立联系
更多推荐

所有评论(0)