关注方向:大模型发布 · GPU算力 · AI芯片 · 云计算 · 大模型API 发布日期:2026年5月18日(周一)


⚡ 第1条:H200获准入华!英伟达高端芯片重返中国,10家大厂受益

核心信息

2026年5月14日,美国政府正式批准英伟达向中国出售H200人工智能芯片,首批许可发放给10家大型企业。H200是目前英伟达最高端的AI训练芯片之一,此次解禁意味着中国AI产业在合规框架下重新获得国际顶级算力支持。经销商渠道成为最大受益方,现货价格已开始跳涨。

性能/价格对比

  • H200 vs H100:H200内存带宽提升约76%(141 GB/s HBM3e),大模型训练效率提升显著
  • 国内H100现货此前基本断供,H200解禁后预计将填补高端算力缺口
  • 市场传言H200国内含税单价或达30万美元/卡级别

对开发者/企业的影响

企业可合规采购H200集群,大幅缩短千亿参数模型训练周期;成本虽高但相比A100时代仍有性价比优势,中大型AI公司布局大模型训练的窗口期已至。

信息来源:雪球 @DrWu|2026-05-14


⚡ 第2条:Cerebras上市暴涨89%,市值破万亿挑战英伟达

核心信息

2026年5月14日,被称为"英伟达挑战者"的AI芯片公司Cerebras Systems正式登陆纳斯达克。IPO定价185美元/股,上市首日开盘即飙至385美元,涨幅约89%,随后冲高至386美元,涨幅扩大到109%,市值一举突破千亿美元。募资规模达55.5亿美元,为2026年以来美国最大IPO。Cerebras以超大芯片尺寸(WSE-3,85万核心)闻名,深度绑定OpenAI算力需求。

性能/价格对比

  • Cerebras WSE-3:单芯片85万个AI核心,内存带宽达21 PB/s,远超英伟达H100集群聚合能力
  • 定位:超大规模大模型训练专用,与英伟达通用GPU形成差异化竞争
  • 市值对比:约1000亿美元 vs 英伟达3万亿美元,仍属"小而美"

对开发者/企业的影响

OpenAI等大客户深度依赖Cerebras算力,上市成功意味着其产能扩张有了资本支撑。未来超大规模模型训练的成本曲线有望被进一步压低,对国内企业而言,Cerebras的崛起为算力采购提供了第三选择。

信息来源:新浪财经|2026-05-16


⚡ 第3条:英伟达 Rubin GPU 确认7月量产!黄仁勋:世代切换比想象更快

核心信息

5月1日台北GTC 2026大会,黄仁勋宣布英伟达 Rubin 系列 GPU 将于2026年7月正式量产面世。Rubin为R100架构的正式命名,采用全新HBM4内存,定位为Blackwell(B100/B200)之后的下一代平台。这意味着当前旗舰B200尚未大规模出货,Rubin已箭在弦上,GPU升级周期压缩至不足一年。

性能/价格对比

  • Rubin vs Blackwell:HBM4内存(vs HBM3e),带宽预计再提升50%以上
  • 英伟达明确:Rubin不是"升级",是全新平台,面向2027-2028年AI需求设计
  • B300已成"旧故事",算力军备竞赛进入Rubin时代

对开发者/企业的影响

采购B系列集群的企业需评估:Rubin量产后B系列折旧速度加快,前期投入存在技术贬值风险。云厂商大规模采购决策将更趋谨慎,"等等Rubin"或成主流心态。

信息来源:MSN/Dr.Wu算力猎场|2026-05-18


⚡ 第4条:华为昇腾950PR量产 + 寒武纪季度盈利10亿,国产AI芯片集体爆发

核心信息

2026年Q1,国产AI芯片迎来标志性时刻:华为昇腾950PR正式量产,华为目标2026年总产量达160万片(含昇腾910C等),为2025年的两倍;同时,寒武纪季度盈利首次突破10亿元人民币,结束长期亏损。国产芯片五强(华为、寒武纪、壁仞、燧原、天数)加速抢占国内算力市场,自主可控进程实质性提速。

性能/价格对比

  • 昇腾950PR:针对大模型训练优化,兼容MindSpore框架,实测训练吞吐量接近A100水平
  • 昇腾910C:目标产量60万片,2025年基础上翻倍,售价预计为H100的60-70%
  • 寒武纪:Q1净利润10亿元,产品线覆盖云端推理和训练

对开发者/企业的影响

DeepSeek V4已明确与华为昇腾合作,国产大模型+国产芯片的组合正在打破对英伟达的单一依赖。对于有合规要求或成本敏感的国内企业,昇腾生态已具备规模化落地条件。

信息来源:新浪财经/EET-China|2026-05-14


⚡ 第5条:GPT-5.5上线定价策略分化,国产API价格战打到"一折"区间

核心信息

5月6日,OpenAI上线GPT-5.5 Instant,以高端定位切入市场,输入token定价约15/百万,输出60/百万,为目前最贵商用模型之一。与此同时,国产大模型API价格战持续加剧——DeepSeek V2.5输入已降至约¥0.1/百万token,豆包大模型input ¥0.3/百万,智谱GLM-4V input ¥0.5/百万,均不到GPT-5.5价格的十分之一。价格分层格局已形成:OpenAI守高端,国产卷中低端。

性能/价格对比

模型

输入价格(¥/M tokens)

输出价格(¥/M tokens)

定位

GPT-5.5

~¥109

~¥436

高端旗舰

Claude 4

~¥22

~¥110

中高端

智谱GLM-5

¥0.5

¥1.5

中端

豆包

¥0.3

¥0.9

性价比

DeepSeek V2.5

¥0.1

¥0.8

低价抢量

对开发者/企业的影响

通用对话场景用国产模型已完全够用,成本可降低90%以上;GPT-5.5适合高可靠性、强推理的B端生产场景。企业应建立模型分层调用策略——日常任务用国产廉价模型,核心任务切换高阶模型,实现成本与效果的平衡。

信息来源:知乎/腾讯云开发者社区|2026-05-07至05-13


📌 本简报由 英辰朗迪AI获客账号整理。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐