收藏必看!从“全球大模型第一股“智谱上市,看中国AI大模型发展全貌与程序员学习路径
智谱华章作为中国大模型领军企业,在港交所成功上市成为"全球大模型第一股"。从清华实验室孵化起步,智谱坚持自研GLM技术路线,完成从GLM-130B到ChatGLM的快速迭代。面对美国实体清单制裁,智谱以技术硬实力回应,推出新一代模型。财务数据显示其高增长高亏损的典型AI企业特征,研发投入达44亿元。在巨头环伺的竞争环境下,智谱持续加码预训练投入,GLM-4.7已在部分领域达到全
智谱华章作为"全球大模型第一股"在港交所上市,展现了中国大模型企业从清华实验室走向国际舞台的历程。文章详述了智谱从GLM-130B到ChatGLM的技术迭代、应对美国实体清单的策略、高增长高亏损的商业模式,以及在巨头环伺下中国大模型行业的竞争格局。对程序员而言,智谱的发展路径揭示了AI大模型技术演进规律与商业化挑战,值得收藏学习。
2026 年 1 月 8 日,北京智谱华章科技股份有限公司(下称“智谱”)正式在港交所主板挂牌上市,股票代码 2513。这个数字被网友戏称为“AI 我一生”的谐音,倒也与这家公司一路走来的执念相呼应。以每股 116.2 港元的发行价计算,智谱此次 IPO 募资总额约 43 亿港元,上市市值预计超过 511 亿港元。
智谱(02513.HK)开盘报 120.0 港元,较发行价 116.20 港元上涨 3.27%;盘中最高触及 121.0 港元,最低 116.2 港元;截至发稿报 116.5 港元,涨幅收窄至 0.26%,成交额 10.14 亿港元,市值约 512.87 亿港元。

图丨智谱变化股价(来源:腾讯微证券)
这是一个被外界赋予了诸多符号意义的时刻——“全球大模型第一股”、“中国最早的独立大模型公司”、“第一家被美国列入实体清单的中国大模型企业”。标签固然醒目,但标签之下,智谱这六年的故事远比一个“第一”复杂得多。
从实验室到创业公司:清华基因的起点
智谱的根系可以追溯到更早的时间。2006 年,清华大学计算机系知识工程实验室(KEG)的唐杰团队发布了一款名为 AMiner 的科研情报挖掘产品,这是智谱日后技术积累的雏形。
到 2019 年 6 月,智谱正式成立,由清华大学技术成果转化而来,创始班底源自这个成立于 1996 年、国内最早开展自然语言处理和知识图谱研究的实验室。成立当年,智谱就获得了 4000 万元天使轮融资,投资方来自清华大学资管和中科创星。
2020 年底,智谱做出了一个关键决策:从零起步研发 GLM(General Language Model,通用语言模型)预训练架构。这个选择在当时看来并不显眼,毕竟彼时国内市场对大模型的关注度极为有限。智谱既没有走 OpenAI 的 GPT 路线,也没有走谷歌的 BERT(Bidirectional Encoder Representations from Transformers,双向编码器表示转换器)路线,而是选择了自研架构。
2021 年,智谱训练完成百亿参数模型 GLM-10B,同年利用 MoE(Mixture of Experts,混合专家架构)成功训练出收敛的万亿稀疏模型。2022 年 8 月,智谱合作研发了中英双语千亿级超大规模预训练模型 GLM-130B 并开源,这比 ChatGPT 发布早了三个月。同年 11 月,斯坦福大学大模型中心对全球 30 个主流大模型进行全方位评测,GLM-130B 成为亚洲唯一入选的大模型。

图丨 GLM-130B(来源:清华大学)
但这段时期的智谱,在商业上几乎处于“隐身”状态。据报道,2021 年底至 2022 年是智谱创立以来商业化色彩最浅的一年,当时国内市场并不关注大模型,直到第一批风投“冒险”入场,智谱才成功拿到一笔续命的融资。
ChatGPT 之后:极速迭代与国产突围
2022 年 11 月 30 日,ChatGPT 发布,全球 AI 行业的节奏被彻底改写。由于此前的技术先发优势,智谱仅用两个月就开发出 ChatGLM。2023 年 3 月 14 日,GPT-4 发布的同一天,智谱发布 ChatGLM,并开源 ChatGLM-6B。这个时间节点的选择,多少带有一点“隔空叫板”的意味。
此后的智谱进入了高速迭代期。模型迭代保持每 3 个月一次的速度,2023 年分别在 3 月、6 月、10 月推出 ChatGLM、ChatGLM2 与 ChatGLM3。8 月,智谱清言上线,成为首批通过大模型备案的产品。资本市场的热情随之涌入。2023 年,智谱累计获得超 25 亿人民币融资,国内多家顶级风投与产业资本纷纷抢投。
2024 年 1 月,智谱发布新一代基座大模型 GLM-4,相比上一代 GLM-3 实现了 60% 的性能全面提升,逼近 GPT-4 水平。但智谱 CEO 张鹏在当时的采访中并未回避现实:由于起步晚、算力受限等因素制约,国内大模型与国外最先进团队还有将近一年的差距。“追赶者”的身份,他没有否认。
实体清单与港股转向:外部压力下的抉择
2025 年 1 月 15 日,美国商务部工业安全局(BIS)将智谱及其子公司列入出口管制实体清单。这是美国首次将中国大模型公司列入该清单,理由是智谱“通过开发和整合先进的人工智能研究推动了中国的军事现代化”。
智谱当晚即发布声明,称这一决定缺乏事实依据,并强调“鉴于智谱掌握全链路大模型核心技术的事实,被列入实体清单不会对公司业务产生实质影响”。次日,智谱发布了全新端到端模型 GLM-Realtime,同步升级 GLM-4-Air 和 GLM-4V-Plus 模型,并推出 Flash 系列普惠模型免费开放。前脚被制裁,后脚就上新模型,颇有几分“掀桌子硬刚”的味道。
但制裁的影响无法全然忽略,美国对 AI 的管制已从传统硬件延伸到整个技术生态,包括算法、大模型、AI 工具链和应用层,未来可能在人才等方面对中国实现更广范围的战略脱钩。短期内,国内 AI 企业在算力上对美国高端芯片有一定依赖,高性能计算能力可能受到限制。
或许正是考虑到这些因素,智谱的上市路径在 2025 年 7 月发生了调整——从原本计划的 A 股转向香港。据市场分析,主要原因是美国监管环境对中国科技公司日益严格,港股市场在灵活性和国际化程度上更具优势。2023 年港交所推出的特专科技上市新规(18C 章),将 AI 企业纳入支持范围,持续盈利不再成为硬门槛。2024 年门槛进一步降低,已商业化公司市值要求从 60 亿港元降至 40 亿港元。这为智谱这样“高增长、高亏损”的企业打开了一扇门。
高增长与高亏损并行的现实
招股书披露的财务数据,勾勒出一幅典型 AI 模型公司的画像:收入增长迅猛,亏损同样巨大。
2022 年至 2024 年,智谱收入分别为 5740 万元、1.245 亿元、3.124 亿元,年复合增长率高达 130%;2025 年上半年收入达 1.91 亿元,同比增长 325%。与此同时,2022 年至 2024 年净亏损分别为 1.44 亿元、7.88 亿元、29.58 亿元,三年半累计亏损超过 62 亿元。
这种“高增长伴随高亏损”的模式,与 OpenAI、Anthropic 等美国同行如出一辙。科技记者 Alex Wilhelm 在其 Substack 专栏中分析智谱的 IPO 文件时指出,最突出的特征是建设先进 AI 模型的成本“令人难以置信地昂贵”。2024 年上半年,智谱营收 640 万美元,运营亏损却高达 1.469 亿美元;2025 年上半年营收增至 2720 万美元,亏损也扩大到 2.711 亿美元。

(来源:招股书)
钱烧在了哪里?主要是研发。招股书显示,2022 年至 2024 年智谱研发投入分别为 8440 万元、5.289 亿元、21.954 亿元,2025 年上半年研发投入为 15.947 亿元,累计研发投入约 44 亿元,是同期营收的 8 倍以上。截至 2025 年 6 月,公司研发人员占比高达 74%。
毛利率方面,智谱表现尚可,2022 年至 2024 年分别为 54.6%、64.6%、56.3%,2025 年上半年为 50%,持续保持在 50% 以上的水平。
不过,这个数字的参考价值有限。大模型行业有个特殊之处:真正“烧钱”的环节是模型训练和迭代,而这部分支出体现在研发费用里,并不进入营业成本的计算。毛利率衡量的只是模型“跑起来之后”每一次 API 调用的边际收益,至于前期砸进去的几十亿研发投入,账面上和毛利率毫无关系。智谱累计研发支出约 44 亿元,是同期营收的八倍以上,对比这个数字,50% 的毛利率就显得没那么亮眼了。
此次 IPO 募集的资金,对智谱而言是支撑其持续发展的 “弹药”。招股书显示,募得资金的 70% 用于持续增强通用 AI 大模型研发能力;10% 用于持续优化 MaaS 平台;10% 用于发展业务合作伙伴网络及战略投资;10% 用于营运资金及一般用途。
也就是说:钱主要继续砸在模型与算力体系,其次是把 MaaS 做成可持续交付的平台,再用生态与投资补齐场景与渠道。
值得注意的是,智谱的营收结构与 OpenAI 有所不同。OpenAI 的大部分收入来自消费者订阅,而智谱在招股书中明确表示,预计大部分销售将来自企业客户。智谱采用 MaaS(Model as a Service,模型即服务)模式,通过 API 调用向开发者和企业输出通用智能能力。据招股书披露,智谱 API 平台企业和开发者用户已超过 290 万,2025 年上半年本地化部署占总营收比 84.8%,云端部署占比 15.2%。
六小虎分化与大厂环伺
智谱敲钟的背景,是中国大模型行业正在经历的一场剧烈重组。
2025 年初,DeepSeek 以开源、免费、高性能的组合拳震动市场,打乱了原有的竞争节奏。各行各业的企业纷纷拥抱开源模型,价格战从 API 调用延伸到整个服务链条。
与此同时,字节跳动和阿里两大巨头全面下场。字节 2026 年资本开支规划约 1600 亿元人民币,其中 AI 芯片预算约 850 亿元;阿里则启动了“三年 3800 亿”的新基建计划。在人才争夺上,头部大厂更是不计成本,据行业报告,字节已成为国内 AI 人才的头号金主,“六小虎”体系内 2025 年上半年有超过 10 位核心高管离职,不少加入了大厂阵营。
曾经风光无限的“AI 六小虎”正在加速分化。零一万物已退出基础模型竞争,预训练团队整体并入阿里通义;百川智能转向医疗垂直领域;月之暗面和 MiniMax 专注 C 端;阶跃星辰在 B 端和 C 端均有布局。有行业人士认为,最终能持续参与基础大模型竞争的玩家可能收敛为“基模五强”——DeepSeek、阿里、字节、阶跃和智谱。李开复更悲观,他预言中国最终只会剩下三家大模型公司。
在这种背景下,智谱选择加码预训练投入。
7 月发布的 GLM-4.5 被定位为“首款原生 Agent 基座模型”,在 12 个评测基准中取得全球第三、国产第一的成绩。9 月的 GLM-4.6 在 Claude Code 真实环境测试中达到 Sonnet 4 水平,200K 上下文窗口较行业主流的 128K 提升 56%。
12 月 23 日,上市前发布的 GLM-4.7 在编码能力、长程任务规划方面进一步强化,在全球百万用户盲测的 Code Arena 上与 Anthropic、OpenAI 的模型并列编码全球第一,超越了谷歌 Gemini 和 xAI 的 Grok。

图 | 智谱模型迭代(来源:招股书)
这种技术上的激进姿态,为智谱获得了外界的认可,2025 年 9 月,智谱入选了《麻省理工科技评论》TR50“50 家聪明公司”榜单;也在 OpenRouter 等国际平台上赢得了实打实的市场份额——GLM-4.5 和 GLM-4.6 自上线以来调用量长期位居全球前十,付费 API 收入据报道超过了所有其他国产模型之和。
不过,这些亮眼的数据背后也有隐忧。技术领先与商业转化之间并不存在必然的等号,大模型行业的残酷之处在于,模型能力的“半代差距”往往可以被快速抹平,DeepSeek 的异军突起就是最好的例证。而且,上述技术进展尚未体现在招股书的财务周期中,其带来的用户增长和收入贡献,需要在后续财报中才能看到。
未解的问题
智谱的 IPO 吸引了 11 家基石投资者,共认购约 29.8 亿港元,占比近七成。阵容涵盖国资、险资、公募、私募,包括上海高毅、泰康人寿、广发基金等知名机构。2019 年以来,智谱完成 8 轮融资,累计募资超 83 亿元,背后站着美团、蚂蚁、阿里、腾讯、小米、红杉、高瓴等一众明星资本。不夸张地说,国内能投的机构几乎投了个遍。
上市将带来新的考验。作为一家上市公司,智谱需要面对季报、年报的周期性披露,投资者会盯着收入增长、亏损收窄、客户留存这些硬指标。华安证券研报认为,智谱上市或将引导 AI 大模型厂商的叙事逻辑从“讲述技术故事”转变为“商业价值兑现”。对于长期缺乏公开市场参照的中国大模型行业而言,智谱的市盈率、市销率也将成为一级市场谈判的“定价锚”。
但“全球大模型第一股”的光环背后,也悬着几个悬而未决的问号。技术领先能否转化为商业持续增长?2025 年 GLM 系列连续登顶多项榜单,但榜单排名与商业收入之间似乎并无必然的转化链条。在巨头环伺的市场格局下,独立大模型公司的生存空间究竟有多大?大厂们手握资金、生态和算力优势,独立厂商如何在夹缝中找到差异化位置,仍是未解难题。
从学者创业到职业经理人接棒,智谱完成了公司治理层面的一次过渡。而在更宏观的层面上,中国大模型产业也正在经历一场从“技术奇观”向“生产工具”的转型。
六年前,一群清华教授和他们的学生在实验室里写下第一行 GLM 代码的时候,大概不会想到,这家公司会成为中美科技博弈、资本市场波动和产业格局重塑的交汇点。1 月 8 日的钟声响起之后,智谱将不再只是一家创业公司,而是一家需要每个季度向公众交代经营成果的上市企业。
如何系统的学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
一直在更新,更多的大模型学习和面试资料已经上传带到CSDN的官方了,有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇

01.大模型风口已至:月薪30K+的AI岗正在批量诞生

2025年大模型应用呈现爆发式增长,根据工信部最新数据:
国内大模型相关岗位缺口达47万
初级工程师平均薪资28K(数据来源:BOSS直聘报告)
70%企业存在"能用模型不会调优"的痛点
真实案例:某二本机械专业学员,通过4个月系统学习,成功拿到某AI医疗公司大模型优化岗offer,薪资直接翻3倍!
02.大模型 AI 学习和面试资料
1️⃣ 提示词工程:把ChatGPT从玩具变成生产工具
2️⃣ RAG系统:让大模型精准输出行业知识
3️⃣ 智能体开发:用AutoGPT打造24小时数字员工
📦熬了三个大夜整理的《AI进化工具包》送你:
✔️ 大厂内部LLM落地手册(含58个真实案例)
✔️ 提示词设计模板库(覆盖12大应用场景)
✔️ 私藏学习路径图(0基础到项目实战仅需90天)






第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

更多推荐



所有评论(0)