📢 本周 AI 快讯 | 1 分钟速览🚀

1️⃣ 🔥 DeepSeek 下周发布 V4 :万亿参数原生多模态大模型,每 token 仅激活约 320 亿参数,上下文扩展至 100 万 token,与华为、寒武纪完成推理端深度适配。

2️⃣ ⚡ DeepSeek 联合北大清华发布 DualPath :专攻 Agent 多轮对话场景下的 KV-Cache 瓶颈,基于 DeepSeek V3.2 实测吞吐量最高提升 1.96 倍,仅约 5000 行代码改动。

3️⃣ 🐾 阿里开源桌面 Agent 工具 CoPaw :对标 OpenClaw 的国产平替方案,原生接入钉钉、飞书、QQ 等平台,兼容千问系列 API 与 Ollama 等本地推理框架。

4️⃣ 🧠 千问 3.5 开源家族扩容Qwen3.5-35B-A3B 以不到七分之一参数量全面超越前代 Qwen3-235B-A22BQwen3.5-Flash API 百万 token 上下文低至 0.2 元。

5️⃣ 🤖 MiniMax 上线 MaxClaw :基于 OpenClaw 框架的云端托管方案,20 秒一键部署,底层由 M2.5 模型驱动,Expert 2.0 支持自然语言创建 Agent。

6️⃣ 🎨 谷歌发布 Nano Banana 2 :Pro 级画质 Flash 级速度,单张生成成本降至 0.067 美元,盲评排行即登文生图第一,覆盖 141 个国家和地区。

7️⃣ 🖥️ Perplexity 发布 Computer :19 个 AI 模型协同编排的「数字员工」,Claude Opus 4.6 负责核心推理,Gemini 做深度研究,仅面向 Max 订阅用户开放。

8️⃣ 📱 Claude Code 上线 Remote Control :手机扫码即可接管本地编程会话,所有计算仍在本地执行,Claude Code 年化收入已达 25 亿美元。

9️⃣ 🔗 Claude Cowork 嵌入 Excel 和 PowerPoint :跨应用上下文传递,覆盖 10 个岗位方向;Anthropic 同步收购计算机操控 Agent 公司「Vercept」。

1️⃣0️⃣ 💰 OpenAI 完成 1100 亿美元融资 :亚马逊 500 亿领投,英伟达和软银各投 300 亿,投后估值达 8400 亿美元,ChatGPT 周活超 9 亿。


01|「DeepSeek V4」下周发布,万亿参数原生多模态,华为寒武纪联手适配

2 月 28 日,《金融时报》援引两位知情人士消息称,DeepSeek 将于下周发布新一代多模态大模型 V4,原生支持图片、视频和文本生成。这是继去年 1 月 R1 推理模型以来 DeepSeek 首次重大更新,间隔超过一年。据多方信息汇总,V4 采用万亿参数级 MoE 架构,每个 token 仅激活约 320 亿参数,上下文窗口扩展至 100 万 token。2 月 11 日 DeepSeek 已悄悄将网页端和 App 的上下文从 12.8 万升级到 100 万,被业界视为 V4 的预演。

V4 最引人关注的变化是芯片路线。DeepSeek 与华为、寒武纪合作完成了推理端的深度适配优化,未向英伟达提供模型预览,也没有针对英伟达产品做优化。《金融时报》此前曾报道 DeepSeek 尝试在华为硬件上完成预训练但遇到技术困难,V4 的适配进展意味着国产算力在推理侧已取得实质性突破。发布时将附带简要技术说明,详细工程报告约一个月后跟进。

就在本周一,Anthropic 公开指控 DeepSeek、月之暗面和 MiniMax 通过约 2.4 万个虚假账户与 Claude 进行超 1600 万次对话,以「蒸馏」方式提取模型能力。OpenAI 本月也提交了类似指控。回顾去年 1 月 R1 发布当天,纳斯达克跌 3%,英伟达单日蒸发 6000 亿美元市值。华尔街已在为 V4 可能带来的「DeepSeek 2.0 时刻」做准备。


02|DeepSeek 联合北大清华发布推理框架「DualPath」,Agent 吞吐量翻倍

2 月 25 日,DeepSeek 联合北大、清华发布 Agent 推理框架「DualPath」,专门解决多轮对话场景下 KV-Cache 的存储 I/O 瓶颈。核心思路不复杂:Agent 应用中每轮对话超过 95% 的上下文是复用的,传统架构把所有缓存加载任务压在预填充引擎的存储网卡上,带宽瞬间打满;而解码引擎的存储网卡却在闲置。DualPath 开辟第二条路径,先把缓存读到解码引擎,再通过 RDMA 高速网络传给预填充引擎,实现存储带宽的全局池化。

实测基于 DeepSeek V3.2(660B)等三款模型,DualPath 离线推理吞吐提升最高 1.87 倍,在线服务吞吐平均提升 1.96 倍,首 token 延迟显著优化,逐 token 生成速度几乎不受影响。整套改动仅约 5000 行代码,底层依赖 DeepSeek 自研的分布式存储系统 3FS。论文发布时间正好在 V4 前夕,等于提前亮出了 Agent 场景的推理基础设施。


03|阿里开源桌面 Agent 工具「CoPaw」,对标 OpenClaw,钉钉飞书 QQ 全平台接入

2 月 28 日,阿里通义实验室将桌面 Agent 工具 CoPaw 正式开源。CoPaw 对标近期爆火的 OpenClaw(GitHub 23.6 万星),主打「国产平替」路线,原生接入钉钉、飞书、QQ、Discord、iMessage 等聊天平台,三条命令即可本地部署,也支持通过阿里云计算巢一键上云。模型端兼容千问系列云端 API、Ollama、llama.cpp 以及苹果芯片本地推理的 MLX,开发者可自由切换。核心架构做了模块化重构,Prompt、Hooks、Tools、Memory 各组件解耦,二次开发门槛不高。

和 OpenClaw 类似,CoPaw 也内置了主动心跳机制和长期记忆功能,能定时查邮件、整理待办,并在对话中自动提取用户偏好写入记忆。不过 OpenClaw 创始人 Peter Steinberger 已于 2 月 14 日宣布加入 OpenAI,项目将移交给开源基金会,后续发展存在不确定性。CoPaw 卡在这个时间节点开源,对想用国内平台又不想折腾海外工具的用户来说,算是一个现成的替代选项。


04|千问 3.5 开源家族扩容,「35B-A3B」超越前代 235B,百万 token 上下文低至 0.2 元

2 月 25 日,阿里在除夕发布的 Qwen3.5 旗舰模型基础上继续扩充开源矩阵,一次性放出三款中等规模模型。最值得关注的是 Qwen3.5-35B-A3B,总参 350 亿仅激活 30 亿,性能却全面超越前代的 Qwen3-235B-A22BQwen3-VL-235B-A22B,以不到七分之一的参数量完成了跨代反超。Qwen3.5-122B-A10B 在多步推理、工具调用等复杂 Agent 任务上缩小了与顶尖闭源模型的差距;Qwen3.5-27B 是纯密集架构,可在单张 GPU 上运行,适合本地部署。

三款模型均已在 GitHub、Hugging Face 和魔搭社区开源。同步上线的 Qwen3.5-Flash API(与 35B-A3B 对齐的托管版本)默认支持 100 万 token 上下文,内置官方工具链,阿里云百炼定价每百万 token 0.2 元。回看整个 Qwen3.5 系列,旗舰版 3970 亿总参、仅激活 170 亿,采用 MoE 加门控线性注意力(Gated Delta Networks)的混合架构,32k 上下文吞吐量是 Qwen3-Max 的 8.6 倍,MMLU-Pro 得分 87.8 超过 GPT-5.2,GPQA 88.4 分高于 Claude 4.5


05|MiniMax 上线「MaxClaw」,基于 OpenClaw 一键部署,Expert 2.0 同步升级

2 月 26 日,MiniMax 发布 Agent 平台两项更新。MaxClaw 是基于 OpenClaw 框架构建的云端托管方案,直接集成在 MiniMax Agent 网页端,用户点击部署后 20 秒内即可获得一个运行中的 Agent,无需自建服务器、配置 Docker 或管理 API Key。底层由 MiniMax 自家的 M2.5 模型驱动,2290 亿总参数 MoE 架构,每 token 仅激活约 100 亿参数,推理成本约为 Claude 3.5 Sonnet 的七分之一到二十分之一。内置长期记忆、图片视频生成、网页搜索等技能,支持接入飞书、钉钉等平台。

同步上线的 Expert 2.0 简化了 Agent 创建流程。用户不再需要手动配置 Skill、SubAgent 和 MCP,也不用编排提示词结构,只需用自然语言描述任务目标,系统自动完成 SOP 梳理、工具编排和能力配置。平台已有超过 1 万个现成的专家 Agent 可供调用。结合 01 条阿里 CoPaw 来看,国内厂商正集体抢占 OpenClaw 生态的「托管化」机会,把原本需要折腾命令行的 Agent 工具包装成开箱即用的产品。此前月之暗面也上线了类似产品「Kimi Claw」,内置 5000 多个社区技能和 40GB 云存储。国内 AI 厂商正集体抢占 OpenClaw 生态的「托管化」机会,把原本需要折腾命令行的 Agent 工具包装成开箱即用的产品。


06|谷歌发布「Nano Banana 2」,Pro 级画质 Flash 级速度,141 国同步上线

2 月 26 日,谷歌发布新一代图像生成模型 Nano Banana 2(技术名 Gemini 3.1 Flash Image),即刻替换 Gemini App 中所有模式的默认图像引擎。新模型将去年 11 月 Nano Banana Pro 的高画质能力迁移到 Flash 架构上,单张图片生成成本从 0.134 美元降至 0.067 美元,生成速度大幅提升,同时支持 512px 到 4K 多种分辨率和自定义宽高比。独立评测机构 Artificial Analysis 的 Image Arena 盲评排行中,Nano Banana 2 上线数小时即冲到文生图第一名。

Nano Banana 2 模型可调用谷歌搜索的实时图片和信息来渲染特定主题,生成信息图、流程图等数据可视化内容;文字渲染精度明显提升,支持多语言图内翻译;单次对话中最多保持 5 个角色和 10 个物体的外观一致性,适合分镜和叙事创作。覆盖范围也够广,除 Gemini App 外同步登陆谷歌搜索 AI Mode、Google Lens、视频工具 Flow、Google Ads 以及 AI Studio 和 Vertex AI 开发者平台,覆盖 141 个国家和地区。AI Pro 和 Ultra 订阅用户仍可通过菜单切换回 Nano Banana Pro。


07|Perplexity 发布「Computer」,19 个模型协同编排,Max 订阅用户可用

2 月 25 日,Perplexity 推出多模型编排系统 Computer,定位不是聊天机器人也不是单一 Agent,而是能自主拆解任务、分配子 Agent、持续运行数小时甚至数月的「数字员工」。用户描述想要的结果,Computer 自动拆分为子任务并分配给 19 个 AI 模型中最合适的那一个:Claude Opus 4.6 负责核心推理,Gemini 做深度研究,Nano Banana 生成图片,Veo 3.1 做视频,Grok 处理轻量快速任务,ChatGPT 5.2 承担长上下文召回和广域搜索。每个任务在独立的云端沙盒中运行,配有真实文件系统、浏览器和工具集成。

CEO Aravind Srinivas 引用乔布斯的话:「音乐家演奏乐器,我演奏管弦乐队。」这句话概括了 Computer 的核心逻辑,没有哪个单一模型能通吃所有任务,专业化编排才是出路。和 Claude Cowork 相比,Computer 不限于单一模型家族;和 OpenClaw 相比,全程云端运行,不碰本地文件系统,安全边界更清晰。不过目前仅面向 Max 订阅用户开放(200 美元/月),Pro 用户需等后续扩容。Perplexity 去年底已关闭广告业务,转向高端订阅路线,Computer 是这一战略转型的核心产品。


08|Claude Code 上线「Remote Control」,手机接管本地编程任务

2 月 25 日,Anthropic 为编程 Agent 工具 Claude Code 推出「远程控制」(Remote Control)模式。开发者在终端输入 /rc 即可生成一个会话链接和二维码,用手机扫码后直接接管本地编程会话。关键区别在于,所有计算和文件操作仍在本地电脑执行,手机只是远程窗口,本地文件系统、MCP 服务器和项目配置全程不离开开发者的机器。连接采用纯出站 HTTPS,不开放任何入站端口,安全模型比传统远程桌面方案更轻量。

这个功能的背景是 Claude Code 正在经历自己的「ChatGPT 时刻」。截至 2 月,Claude Code 年化收入达 25 亿美元,较年初翻倍;VS Code 插件日安装量 2900 万次;全球公开 GitHub 提交中约 4% 由 Claude Code 生成。Remote Control 目前作为研究预览面向 Max 用户(100 至 200 美元/月)开放,Pro 用户(20 美元/月)后续跟进,Team 和 Enterprise 暂不支持。


09|「Claude Cowork」嵌入 Excel 和 PowerPoint,Anthropic 收购「Vercept」

2 月 24 日,Anthropic 发布 Cowork 企业级插件体系,「Claude Cowork」正式嵌入 Excel、PowerPoint、Slack、Gmail、Google Drive 等办公工具。核心更新是跨应用上下文传递,在 Excel 处理完财务数据后 Claude 能直接在 PowerPoint 生成演示文稿,告别复制粘贴。插件覆盖 HR、设计、运营、财务分析、投行等 10 个岗位方向,合作伙伴包括 FactSet、标普全球、伦交所等。整套插件开源可移植,企业通过私有市场管理分发,不被单一生态锁定。

次日,Anthropic 宣布收购西雅图 AI 创业公司「Vercept」。Vercept 的核心产品 Vy 是云端计算机操控 Agent,能远程操控 MacBook 完成多步骤任务,自研视觉模型 VyUI 在 UI 定位基准上超过 OpenAI 和谷歌同类方案。收购后 Vy 将于 3 月 25 日关停,团队并入 Anthropic。这是继去年 12 月收购 Bun(编程 Agent 引擎)之后的第二笔收购,让 Claude 从「生成文本」进化为「操作软件」。目前 Claude Sonnet 4.6 在 OSWorld 计算机操控基准上得分 72.5%,较 2024 年末首次发布时的不到 15% 提升了近 5 倍。


10|OpenAI 完成「1100 亿美元融资」,亚马逊 500 亿领投,估值达 8400 亿

2 月 27 日,OpenAI 宣布完成 1100 亿美元新一轮融资,刷新私募融资历史纪录,是去年由软银领投的 400 亿美元上一轮的近三倍。亚马逊出资 500 亿美元(首批 150 亿即刻到账,剩余 350 亿视里程碑达成情况分期注入),英伟达和软银各投 300 亿美元。投前估值 7300 亿美元,含本轮资金后整体估值达 8400 亿。长期股东微软未参与本轮,但双方发声明强调现有合作条款不变。轮次仍未关闭,OpenAI 正在与主权财富基金等金融投资者洽谈追加约 100 亿美元。

融资之外是两笔绑定式战略合作。OpenAI 将在 AWS 上使用 2 吉瓦 Trainium 芯片算力,并追加 1000 亿美元、为期 8 年的云服务支出;AWS 成为 OpenAI 企业级 Agent 平台 Frontier 的独家第三方云分发商。同时,OpenAI 承诺消费英伟达 2 吉瓦 Vera Rubin 训练算力和 3 吉瓦推理算力。批评者指出这是典型的「循环融资」,投资方和供应商高度重叠,互相抬高营收。OpenAI 目前仍未盈利,2030 年前总算力支出目标约 6000 亿美元。ChatGPT 周活已超 9 亿,付费订阅用户突破 5000 万,Codex 周活用户年初至今增长两倍至 160 万。


我是木易,Top2 + 美国 Top10 CS 硕,现在是 AI 产品经理。

关注「AI信息Gap」,让 AI 成为你的外挂。


Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐