最强开源模型深夜爆火！GLM-4.5接入Claude Code直接起飞～

【国产大模型GLM-4.5实测体验：性能比肩Claude4，价格仅零头】智谱AI最新开源的GLM-4.5模型采用混合专家架构，包含3550亿和1060亿参数两个版本，在12项权威评测中斩获全球第三、国产第一的成绩。实测显示其代码生成能力已超越Claude4，2分钟内可完成复杂医疗咨询平台开发，并能无缝接入ClaudeCode框架。相比Claude4高昂的API费用（输入21.5元/百万token

java袋鼠帝

1067人浏览 · 2025-08-02 13:49:31

java袋鼠帝 · 2025-08-02 13:49:31 发布

大家好，我是袋鼠帝。

AI圈卷已经说累了，最近不是在跑Case，就是在找Case的路上...

昨晚被智谱的GLM-4.5刷屏了，很多人都在讨论。

GLM-4.5是他们的新一代旗舰模型而且，它又又又是开源的！

智谱还发了50块包月爽玩券（领取方式放最后了），所以，我忍不住第一时间就上手测试了。

采用混合专家（MoE）架构，包含两个版本：

GLM-4.5: 3550亿总参数，320亿激活参数。

GLM-4.5-Air: 1060亿总参数，120亿激活参数。

跟Claude4一样是混合推理模型（推理/非推理）

两个版本全部在Hugging Face和ModelScope上开源，并且遵循最宽松的MIT协议。

定位是专为智能体（Agent）应用打造的基座模型，原生融合了推理、代码、Agentic能力。

在MMLU Pro、MATH等12个权威基准综合评测中，拿下了全球第三、国产第一、开源第一的好成绩！

不测不要紧，当我测完第一个Case，我立马就来精神了（龙马精神！）

对于智谱这次的新旗舰模型，我只能说，这次，国产模型真的崛起了！

它给我的感觉，尤其是在代码能力上，已经隐隐超越了Claude4。

关键是价格，国产模型的价格都非常良心，但这次智谱官方放出的GLM-4.5 API价格还是把我惊到了：

输入：2元 / 百万 tokens

输出：8元 / 百万 tokens

没有对比就没有伤害，我们来看看Anthropic官方的Claude-4-sonnet的API价格：

输入：$3 / 百万 tokens (约21.5元)

输出：$15 / 百万 tokens (约107.4元)

性能顶级，价格却只有人家的零头。

而且你看看这个生成速度

也快了吧。

Claude4，这次是真的再见了

本地的Cluade Code也完全不需要舔着脸去用原生昂贵的Claude模型了，直接上GLM-4.5，又便宜，又强，速度还快！（往后翻，有接入教程和全栈开发实测）

卷吧卷吧，这样我的本地Agent就会越来越NB，哈哈哈～

话不多说，我们Case见真章。

一、GLM-4.5原生模型实测

我们先来看看GLM-4.5模型的原生能力究竟如何。

>/ Case 1. PPT生成

先来个PPT试试

进入z.ai，在对话框下面选中AI PPT（进入PPT模式）

prompt：你挑选英雄联盟里面10个英雄，做一个英雄背景介绍PPT，炫酷一点

视频封面

整个PPT太酷炫了，而且每个英雄的图片和介绍都非常准确

下次有机会去演讲啥的，做PPT就用z.ai了

它搜的图是真准，而且配上去毫不违和。

>/ Case 2. AI导诊网站

正好前几天住院，那就让它写一个简单的医院系统吧

太久没进医院了，感觉县城里面医院的流程太繁琐了，感觉真可以搞个AI应用来代替大部分流程。起码问诊那一步，完全可以让AI来，因为我感觉有些问诊的医生还没有大模型的回答专业... 先测试一下它的前端代码能力。

创建一个医疗咨询平台：患者可描述症状、上传病历图片，查看AI诊断建议。关键功能：症状分析、附近医院地图、用药提醒。要求：符合HIPAA隐私规范，响应时间<2秒

它先是花了大概几秒思考和规划，然后开始输出代码，真就是疯狂刷屏。

生成速度贼快，不到2分钟，整个项目的代码就生成完毕了

具体效果请看下面的VCR～

完全想不到仅仅是靠大模型原生能力，就能通过几个简短的描述，在短短2分钟左右，生成一个拥有这么多功能的复杂前端网页。

然后它还使用了浏览器自带的localStorage模拟了数据库。

视频封面

这是原生模型一次性生成的，我只能说太强了！

>/ Case 3. 全栈愿望清单

我们也可以先在z.ai上面体验GLM-4.5的全栈开发能力

我想做一个全栈的愿望清单应用。功能要求：能添加新愿望，能展示所有愿望列表，能通过勾选框把愿望标记为‘已实现’，也能删除愿望。

在z.ai首页点击「全栈开发」就可以进入全栈发开模式

这个全栈开发是有项目空间来存放生成的前后端代码，包含数据库，目前支持同时存在两个空间（这个空间应该是k8s集群的一个pod，可以随时释放和创建），多了就需要替换。

生成完毕可以点击右上角发布，也可以下载整个项目

https://e0rbu6mzsmd1-deploy.space.z.ai

整个网站实现了愿望清单的增删改查，以及未完成清单和完成清单的区分。

视频封面

可以看到视频最后，我新开了一个无痕浏览器，输入愿望清单的网址，进去之后数据是还在的，所以这个是真保存到数据库的数据，否则刷新就会不见了。

我保存的愿望是：三连这篇文章的朋友今年都会暴富，还有愿大家身体健康，万事如意。

哈哈哈，希望都能实现～

>/ Case 4. 全球地震监控

这次没有使用全栈开发模式，里面要求添加一个获取地震数据的API调用

我想创建一个实时全球地震监控地图。请使用Leaflet.js地图库和USGS（美国地质调查局）的实时地震API。在世界地图上，用圆点标记出最近24小时内发生的所有地震。圆点的大小或颜色应该根据震级变化，点击圆点可以弹窗显示地震的详细信息（地点、震级、时间）。页面要精美，然后地图上要明显标注，标注的地点要准确生成速度也是非常快

效果如下

视频封面

整个网页上的地震标记，还有相关信息，都是从美国地质调查局地震API接口获取的。整个页面交互也非常棒～

二、GLM-4.5接入Claude Code

原生模型已经这么猛了，那要是接上最强开源编程Agent：Claude Code，岂不是要上天？

智谱官方就支持把GLM-4.5一键接入Claude Code框架。

下面是喂饭级接入教程：

第一步：准备工作

先安装Node.js: 确保你的电脑上安装了Node.js，版本号需要大于等于18。

可以在终端输入node -v查看版本。

然后去智谱开放平台（bigmodel.cn）获取apikey

在API密钥页面创建一个新的apikey，并复制保存好。

https://bigmodel.cn/usercenter/proj-mgmt/apikeys

API调用地址是： https://open.bigmodel.cn/api/paas/v4/chat/completions

模型名称是：glm-4.5

第二步：安装并配置Claude Code

在终端执行Claude Code安装命令。

npm install -g @anthropic-ai/claude-code

如果遇到权限问题，可以参考我上一篇Claude Code的文章里写的解决方案。

然后配置环境变量，这是最关键的一步。

我们需要让Claude Code把请求发送到智谱的API地址，而不是Anthropic的。

对于Mac/Linux用户:

进入终端执行如下命令

# 设置智谱的API代理地址 export ANTHROPIC_BASE_URL="https://open.bigmodel.cn/api/anthropic"

# 设置你的GLM API Key

export ANTHROPIC_AUTH_TOKEN="你刚刚获取的质谱apikey"

对于Windows用户:

进入PowerShell执行下面的指令

$env:ANTHROPIC_BASE_URL="https://open.bigmodel.cn/api/anthropic" $env:ANTHROPIC_AUTH_TOKEN="你刚刚获取的智谱的apikey"

注意：这个环境变量只在当前终端窗口生效。为了永久生效，需要将这两行命令添加到你的~/.zshrc、~/.bash_profile或Windows的环境变量设置中。

第三步：启动

配置好后，在终端输入

claude --dangerously-skip-permissions

这个方式启动可以在后面跑任务的时候畅通无阻（无需人工确认操作）

下面这里选择Yes,proceed

看到熟悉的输入框，就代表你成功启动了由GLM-4.5驱动的Claude Code！

智谱官方文档接入文档（方式同上）：

https://docs.bigmodel.cn/cn/guide/develop/claude

可能有朋友会问，没有配置模型，怎么知道接入的是glm-4.5呢

智谱提供了兼容Anthropic API 的端点： https://open.bigmodel.cn/api/anthropic 这个端点是智谱平台的接口，专门用于配置到各位的Claude Code中。

当Claude Code发起请求时，这个端点会自动将请求转发到智谱的GLM-4.5模型，所以模型这块不用我们管。

接下来，我们上终极挑战，把刚才的AI导诊系统再用Claude Code跑一遍，但这次要求更高。

Prompt：我想做一个AI导诊系统，帮我用Docker在本地启动一个MySQL 8.0服务。然后，为我的AI导诊系统设计数据库表结构，包含'symptoms'和'departments'两张表。写一份详细的后端API文档。最后，基于这份文档，用Node.js+Express写出后端API，并用Vue.js写一个漂亮的、响应式的前端页面，实现完整的导诊流程。项目结构要清晰，给我一个可以运行的完整项目。

GLM-4.5驱动的Claude Code展现出了惊人的执行力，大概7分钟左右跑完了。

它真的在本地docker中启动了一个MySQL数据库

虽然后端服务和前端联调一开始也会有一些bug，但是调整几次之后就ok了。

就这样，一个连接着真实MySQL数据库（它还自己建了表）、包含前后端，并且功能丰富的AI导诊系统就实现了。跟医院的系统风格太像了..

视频封面

不过它存储到数据库的模拟数据有一些是乱码的，视频的最后我也用sql语句查询了MySQL数据库的表，数据是真实存在的，就是显示的时候有点乱码。

另外，我发现智谱还推出了一个50元包月活动，可以无限用GLM-4.5。

Claude Code的重度用户应该知道，Claude Code很费tokens

如果你有大量使用Claude Code的需求，参与这个活动，就能无限畅用GLM-4.5，真的是又快又爽，值得入手。

「最后」

说实话，当看到GLM-4.5跑通最后一个复杂项目时，我内心还是挺感慨的。

我期待国产大模型能够真正与国外的顶级模型正面硬刚已经很久了。

这期间，有过惊喜，也有过失望。

而GLM-4.5的出现，让我第一次有了我们真的站起来了的实感。

并且GLM-4.5跟Claude4一样，也是混合推理模型

它不是在某个单点上追平，而是在综合能力、特别是最考验模型的代码和Agent能力上，我体验下来已经隐隐超越Claude4。

更重要的是，它选择了开源，平台也给出了一个极具诱惑力性的API价格。

所以GLM-4.5应该是我后面的最常用模型了

而各大Agent平台、AI IDE肯定也会迅速跟进接入，所有的国内AI应用都将迎来一波质的提升！

国产AI，越来越有盼头了。

能看到这里的都是凤毛麟角的存在！

如果觉得不错，随手点个赞、在看、转发三连吧~

如果想第一时间收到推送，也可以给我个星标⭐

谢谢你耐心看完我的文章～

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

C++工业级异常处理：防御性编程与契约设计实践

2048 AI社区

模型系列（篇四）-Qwen

2048 AI社区

什么是DeepSeek？如何入门DeepSeek？

准备训练数据（JSON格式）：代码语言：javascript代码运行次数：0运行AI代码解释"instruction": "生成产品描述","input": "无线蓝牙耳机，降噪，30小时续航","output": "XX蓝牙耳机采用主动降噪技术..."启动微调训练：代码语言：javascript代码运行次数：0运行AI代码解释。