这一周,搜索引擎、IT 咨询、SaaS 工具、甚至半数员工,同时在 AI 面前暴露了同一个致命弱点:它们的价值建立在「帮别人理解和执行」上。而 AI 正在把理解和执行的成本压到接近零。

三个中间层在同一周被宣判了

2 月最后一周发生了太多大新闻。OpenAI 拿了 1100 亿美元融资,估值 7300 亿。Anthropic 被美国政府列为「供应链风险」。英伟达(NVDA)Q4 营收 681 亿创历史。美以联合空袭伊朗。黄金创 53 年连涨纪录。随便拿一条出来都是头条。

但把这些新闻摊开看,真正重要的不是哪条最炸裂,而是一条藏在水面下的主线——不同行业的中间层,在同一周集体崩塌了。

搜索中间层。

先把数据摆出来。触发 AI Overviews 的搜索查询,零点击率飙到了 83%。有 AI Overview 的页面,自然搜索点击率从 1.76% 暴跌到 0.61%,降幅 61%。Google AI Mode 更极端——93% 的搜索直接在 AI 里结束,用户连搜索结果页都不看了。Gartner 预测 2026 年传统搜索引擎流量下降 25%。Semrush 预测 LLM 流量将在 2027 年底超过传统 Google 搜索流量。发布者预计三年内搜索引擎流量减少 43%。近九成 SEO 专家将 AI Overviews 和 AI Mode 视为直接流量威胁。

这些不是遥远的预测。Google 二月史无前例地同时推了两个核心更新。广义核心更新打 AI 生成的泛化内容,Discover 核心更新打标题党。这是 Google 历史上第一次给 Discover 单独发核心更新——Discover 和 Search 的算法正式分家。Semrush Sensor 飙到 9.4 分(满分 10),部分站点单周流量波动超过 40%,电商行业 23% 的 Top 3 URL 被换血,部分站点估算自然流量较 2025 年峰值下降 50%-75%。美国 Top 1000 Discover 展示位的独立域名数从 172 降到 158,缩水 8.1%。The Independent 流量暴跌 57%,Reuters 降 20%。

同一周,Shopify 和 Google 联合发布了 Universal Commerce Protocol(UCP)——一套开源标准,让 AI Agent 能直接在对话中完成从发现商品到比价到下单的全流程。不需要跳转到任何搜索结果页,不需要打开任何产品页面。Walmart、Target、Etsy、Wayfair、Best Buy 已经接入。来自 AI 搜索渠道的订单量,一年增长了 15 倍。AI 渠道的客单价持续高于传统流量。

搜索结果页存在的意义是什么?帮用户从海量信息中找到最相关的那几条。当 AI 能直接理解用户意图并给出答案或推荐,搜索结果页这个「中间层」就变得多余了。流量的分配权正在从「谁排在前面」变成「谁被 AI 引用」。

最反直觉的一个数据:被 AI Overviews 引用的品牌,自然点击量反而增加了 35%,转化率是传统搜索的 23 倍。总量在缩,质量在涨。搜索流量的盘子在变小,但被 AI 选中的那一小块,价值在飙升。AEO(Answer Engine Optimization)工具市场在 10 个月内从 7 款爆到 150 多款,增长超过 2000%。Profound 成立 18 个月估值就到了 10 亿美元,专门帮品牌追踪自己在 AI 回答中的可见度,客户包括 Target、Walmart、MongoDB、Figma——服务了 10% 以上的财富 500 强。这条赛道的爆发速度本身就是信号:市场已经在为「被 AI 引用」这件事大规模付费了。

咨询中间层。

2 月 23 日,Anthropic 宣布 Claude Code 上线 COBOL 现代化工具。当天,IBM(IBM)暴跌 12.7%,收于 223.35 美元,创 2000 年 10 月以来最大单日跌幅,市值蒸发超 310 亿美元。二月累计跌幅 27%,是 1968 年以来最差月度表现。Accenture、Cognizant 跟着跌。

IBM 的 Z 系列大型机生意,核心不是硬件,是 COBOL 的锁定效应。IBM CFO James Kavanaugh 亲口说过,一台大型机创造「3 到 4 倍的堆栈乘数效应」——硬件只是入口,真正赚钱的是上面的 COBOL 软件维护和咨询服务。COBOL 处理着美国 95% 的 ATM 交易,数千亿行代码运行在金融、航空、政府系统中。这些系统迟迟没有现代化,不是没人想换,而是理解旧代码的成本比重写还高。这就是咨询公司吃了几十年饭的核心逻辑——客户不是付钱让写新代码,是付钱让理解旧代码。

Claude Code 做了什么?自动映射数千行代码的依赖关系、记录工作流、识别风险。以前需要大型咨询团队干几个月的活,AI 可能几天就完成。VentureBeat 有一篇冷水文章提醒:翻译 COBOL 不等于现代化,真正的难点在于业务逻辑的迁移和测试。这话没错。但市场的反应说明了一件事——当「理解」这件事的成本趋近于零时,靠「帮人理解」吃饭的商业模式就面临坍塌。不管现在 AI 能做到几成,趋势的方向不可逆。

人力中间层。

Block(XYZ)裁了 4000 人,接近员工总数的一半。股价暴涨 24%。Jack Dorsey 给股东的信里把裁员直接归因于「智能工具」,然后补了一句更狠的预测:「大多数公司一年内会得出同样的结论,做出类似的结构性调整。」Block Q4 毛利润同比涨 24%,达到 28.7 亿美元。Cash App 毛利润涨 33%,达到 18.3 亿美元。业绩在涨,人少了一半。华尔街用 24% 的涨幅告诉所有 CEO:市场奖励裁人。

同一周的其他信号也指向同一个方向。Spotify 联席 CEO Gustav Söderström 在 Q4 财报会上说:最资深的开发者从 12 月起「没写过一行代码」。Spotify 内部的 Honk 系统每月合并超过 650 个 AI 生成的 PR,复杂代码迁移节省 90% 工程时间。高级工程师的角色已经从「写代码」变成了「审代码」。Notion 的产品设计师 Brian Lovin 说自己三个月没写过一行前端代码——全交给 Claude Code 了。

这些不是同一类岗位,不是同一个行业,但故事是同一个:AI 消灭的不是工作本身,而是工作中间的「执行环节」——理解需求、翻译成代码、检查结果、传递给下一个人。这些环节以前需要人来做,现在 AI 能做,而且更快、更便宜。

所有中间层的死因都一样:理解成本归零

搜索、咨询、人力——三个看起来毫无关联的领域,中间层同时崩塌。是巧合吗?

不是。因为它们的价值来源是同一个东西:帮别人理解。

搜索引擎帮用户理解哪些信息和自己的需求最匹配。COBOL 咨询帮客户理解几十年前写的旧代码到底在干什么。SaaS 工具帮用户理解复杂的工作流并自动化执行。中层员工帮组织理解上游的指令并翻译成下游的行动。它们的共同点是:在需求和结果之间充当翻译器。

AI 做了什么?它把「理解」这件事的边际成本打到了接近零。

Claude Code 读 1998 年写的 COBOL,跟读 Python 一样轻松——甚至更轻松,因为它不会像人类一样被「古老」吓到。AI Overviews 能直接理解用户的搜索意图并给出答案,不需要先排列十个链接让用户自己翻。Shopify 的 UCP 让 AI Agent 直接理解「想买一双跑步鞋」然后完成全流程,跳过产品列表页、跳过比价网站、跳过购物车页面。

当理解变得免费,「帮别人理解」就不值钱了。

这就是为什么三个不相关的行业在同一周出了同样的事。不是因为 AI 这周突然变强了——模型能力几个月前就到了——而是应用场景的渗透到了临界点。Claude Code 不是这周才会写 COBOL,但这周 Anthropic 把它作为产品正式推了出来。AI Overviews 不是这周才开始吃点击率,但 83% 的零点击率意味着量变到了质变的拐点。Block 不是这周才开始用 AI,但 Dorsey 判断现在到了可以砍掉一半人的时候。

SaaS 行业的信号同样清晰。旧金山创始人 Ira Bodnar 的广告自动化公司 Ryze,在 Claude 推出类似功能后,成交率从 70% 直接跌到 20%。客户问的第一个问题变成了:「Claude 能做,凭什么还要买你的?」Ryze 没有死,但被迫从产品公司转型成了服务公司,给大型广告代理做复杂 workflow 定制。Reddit r/SaaS 上有创业者说因为 Claude 直接关掉了公司。

但硬币的另一面也得看到。Lovable.dev 八个月做到 1 亿美元 ARR,到年底突破 2 亿。用户量 230 万,每天新建 10 万个项目。vibe coding 把「会写代码」从稀缺能力变成了基础工具,也把「建一个软件产品」的门槛拉到了接近零。Micro SaaS 市场预计从 157 亿美元增长到 2030 年的 596 亿美元。Samuel Rondot 辞职自学编程,用 AI 工具搭了多个盈利产品,月收入 28000 美元。Cameron 回父母家省成本,90 天做到 62000 美元 MRR。

中间层在死,但新的东西在长。旧的执行层 SaaS 被 AI 直接吃掉,但超细分的垂直方案、直接解决深层业务问题的工具,反而因为 AI 降低了开发门槛而批量涌现。问题是——中间层消失之后,什么才是真正的护城河?

中间层消失后,护城河只剩三样东西

如果「帮别人理解」不值钱了,什么还值钱?这周的新闻给了三个方向的线索。

信任。

Anthropic 因为拒绝五角大楼的要求被列为「供应链风险」。这个标签以前只给过华为这类外国公司,从未公开用于美国本土企业。Dario Amodei 坚守了两条红线:AI 不能用于对美国公民的大规模监控,AI 不能做完全自主的致命决策。五角大楼的要求是:军方必须被允许将 AI 用于「所有合法用途」。谈判破裂。

同一天,OpenAI 拿到了 Anthropic 拒绝的合同。Sam Altman 对内说 OpenAI 跟 Anthropic 有「相同的红线」,但合同条款写着「国防部可将 AI 系统用于所有合法用途」,限制条件全部参照现行法律。说白了,法律允许的就都能干。Anthropic 要的是在法律之外额外设限,OpenAI 选择把决定权交给政府。

330 多名来自 Google 和 OpenAI 的员工在 notdivided.org 上签署公开信,支持 Anthropic 的立场。讽刺的是,很多 OpenAI 员工签完信回头一看,自己的公司刚接了 Anthropic 拒绝的合同。前特朗普 AI 顾问 Dean Ball 直接称这个定性「几乎肯定是非法的」和「企图谋杀企业」。Anthropic 已宣布将在法庭上挑战。

这件事的底层逻辑:当模型能力越来越同质化——阿里 Qwen 3.5 开源模型已经在消费级硬件上逼近闭源性能,35B-A3B 在 RTX 5080 上跑到 62.98 tokens/秒——信任就成了唯一不可复制的差异化。Anthropic 赌的是短期丢合同,长期赢开发者生态。这个赌注是否正确现在还看不清,但「信任」作为竞争维度被正式摆上桌面,这件事本身就是信号。

验证能力。

SWE-Bench Verified 的污染问题这周继续发酵。前沿模型在 Verified 上得分 70%+,在抗污染的 SWE-Bench Pro 上只有 23%,在私有代码子集上更是约 17.8%。32% 的「成功」补丁存在直接解决方案泄露,31% 通过测试是因为覆盖率不足而非真正正确。OpenAI 自己都承认了问题,建议开发者改用 SWE-Bench Pro。20 个百分点的差距不是「困难差异」能解释的,是记忆。这意味着过去一年 AI 编码领域那些不断刷分的 SOTA 声明,相当一部分建立在虚假基础上。

但真正的启示在实战端。Ladybird 浏览器团队用 AI 两周把 25000 行 C++ 移植到 Rust,零回归。怎么做到的?ECMAScript test262 测试套件全量验证,Rust 解析器和 C++ 解析器字节级对比。没有这套工业级测试基础设施,他们不敢让 AI 碰核心代码。Simon Willison 启动的 Agentic Engineering Patterns 项目说的也是同一件事:Red/Green TDD 天然适配 AI Agent——先写测试确认失败,再让 Agent 写代码直到测试通过。有了明确的「完成标准」,Agent 不会写一堆废代码。

tldraw 把测试套件搬进了闭源仓库。原因很直接:Cloudflare 用 AI 一周内把 Next.js 移植到 Vite。测试代码不是源代码,但它精确描述了代码应该做什么——对 AI 来说,这等于一份完美的规格说明书。当测试套件比源码更值钱,「开源」的定义正在被重写。

AISLE 的 AI 独立发现了 12 个 OpenSSL 零日漏洞,最老的藏了 27 年,扛过了数百万 CPU 小时的模糊测试,NIST 最严重的一个评分 9.8。同一周,Anthropic 的 Claude Code Security 在生产级代码库里找到 500 多个漏洞。AI 找漏洞的速度在加快,AI 制造漏洞的速度也在加快——OpenClaw 上线后发现了 341 个恶意技能包。验证——代码的验证、安全的验证、信息的验证——这是 AI 无法自己完成的闭环,需要外部的真实世界标准来校准。

独特的声音。

Ahrefs 对 75000 个品牌的研究发现:YouTube 提及与 AI 搜索可见度的相关系数高达 0.737,远超所有传统 SEO 指标。不到 10% 被 AI 引用的信息源排在 Google 传统搜索前 10。AI 搜索的排名货币不是链接,是品牌提及。链接是 Web 1.0 时代的信任投票,品牌提及是 AI 时代的信任投票。

Sabrina Ramonov 在视频里说了句到位的话:所有人用同一个 AI,差异化只能来自独特的个人声音。大多数人让 ChatGPT「写好一点」,结果得到的是千篇一律的企业腔——光滑、通顺、没灵魂。Google 二月 Discover 更新明确惩罚泛化内容,奖励深度原创。当 AI 能大批量生成千篇一律的内容时,算法就开始逆向筛选——越像 AI 写的越容易被降权,越有辨识度的越容易被推荐和引用。

创作者经济的数据也在印证这一点。高盛预测创作者经济 2027 年到 4800 亿美元,但 Forbes 管 2026 年叫「整合时代」。RedPeach 调研 2000 个创作者账号,月收入在 500 到 10 万美元之间的,65% 依赖外部团队或 AI 工具。单打独斗的窗口在关。但另一面是——有独特声音和辨识度的创作者,在 AI 内容泛滥的环境里反而更稀缺了。@levelsio 删掉了个人主页上所有收入数据,Build in Public 运动的透明度边界在往回收,但他 40 个创业项目、40 个国家的故事本身就是不可复制的品牌资产。

信任、验证、独特声音——这三样东西有一个共同特征:它们不在需求和结果之间充当中间层,而是直接构成价值本身。中间层被消灭后,只有直接创造价值的人和系统能留在牌桌上。

一个不该被忽略的信号

这周信息密度太大,但有一条和主线无关却必须提:美国和以色列联合空袭伊朗,代号「史诗怒火」。

市场的反应很直接。比特币从 65600 美元跌到 63000。黄金飙到 5464 美元/盎司,创 53 年连涨纪录——从 1973 年以来最长的连涨周期。标普 500 录得年内最大月度跌幅。美债迎来一年最佳月度。CTA 基金把美股仓位砍到 50 百分位。

这跟 AI 有什么关系?

两个层面。第一,地缘风险直接威胁 AI 供应链。半导体制造高度集中在东亚,英伟达(NVDA)91% 的收入来自数据中心,五大云厂商占一半以上。任何大规模军事冲突升级都会冲击芯片供应。第二,避险情绪正在改变资本的流向——从「未来现金流」的 AI 概念股搬向「当下现金流」的价值资产。高盛传统的「质量因子」策略失效,高利润率软件股落后价值股超过 5 个百分点。高盛造了个新词 HALO(Heavy Assets, Low Obsolescence),资金从「轻资产高成长」搬向「重资产低淘汰率」。

中东局势叠加通胀顽固、AI 回报周期不确定性,地缘政治正在给本就脆弱的 AI 估值体系再添一根稻草。

本周市场速记

美股二月收官,标普 500 录得 2025 年以来最差月度表现,道指跌 521 点。科技板块年初至今开局为 2022 年以来最差。但板块内部在剧烈分化——半导体和硬件逆势涨,软件股年内暴跌 23%。市场在区分谁是 AI 的基础设施供应商,谁是 AI 的替代对象。

英伟达(NVDA)Q4 营收 681 亿美元,同比增 73%,数据中心收入 623 亿。Q1 指引 780 亿再超预期。数字全面碾压,股价反跌 5.5%,两日蒸发超 2600 亿。同一天 Salesforce(CRM)涨 4%,Atlassian 涨 10.8%,Zscaler 涨 7.2%。资金在做的事情很明确:从 AI 基建层往应用层搬。华尔街不是否定英伟达的数字,是在问下一个问题——这些资本开支什么时候能变成客户端的 ROI?Gartner 数据显示 80% 的企业报告 AI 对生产率零影响。基建投入和实际回报之间的缺口,是当前 AI 估值的核心风险。

A 股沪指月线三连阳,两会开幕前政策面是最大变量。芯片半导体板块本周回调(国泰中证芯片产业 ETF 联接 A(012414)周跌 2.61%,月跌 5.3%),AI 板块整体稳健(天弘中证人工智能 A(011839)月跌仅 0.66%)。港股通资金持续南下,2 月 27 日沪深两通道合计净买入约 150 亿港币。离岸人民币突破 6.83 创近三年新高。

黄金 5464 美元/盎司创历史新高。比特币从高点 126000 美元回撤约 52%,在 63000-65000 区间企稳。

下周关注:两会政策信号(3 月 3-5 日)、Google Discover 更新全球扩展进度、Anthropic 法律挑战「供应链风险」定性的后续进展。

这一周信息密度极高,但剥开看,所有事件指向同一件事:AI 正在把每一个充当「翻译器」的中间环节干掉。搜索帮用户筛信息——干掉。咨询帮客户读旧代码——干掉。SaaS 帮人执行工作流——干掉。中层员工帮组织把指令翻译成产出——干掉。

翻译器没了,活下来的只有三种:别人信得过的、能验证真假的、声音独特到 AI 模仿不来的。钱到位了,规则在改,中间层在塌。不是翻译器的人,才有下一局。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐