大家好,我是袋鼠帝。

AI圈卷已经说累了,最近不是在跑Case,就是在找Case的路上...

昨晚被智谱的GLM-4.5刷屏了,很多人都在讨论。

GLM-4.5是他们的新一代旗舰模型而且,它又又又是开源的!

 

智谱还发了50块包月爽玩券(领取方式放最后了),所以,我忍不住第一时间就上手测试了。

采用混合专家(MoE)架构,包含两个版本:

GLM-4.5: 3550亿总参数,320亿激活参数。

GLM-4.5-Air: 1060亿总参数,120亿激活参数。

跟Claude4一样是混合推理模型(推理/非推理)

两个版本全部在Hugging Face和ModelScope上开源,并且遵循最宽松的MIT协议。

定位是专为智能体(Agent)应用打造的基座模型,原生融合了推理、代码、Agentic能力。

 

在MMLU Pro、MATH等12个权威基准综合评测中,拿下了全球第三、国产第一、开源第一的好成绩!

 

不测不要紧,当我测完第一个Case,我立马就来精神了(龙马精神!)

对于智谱这次的新旗舰模型,我只能说,这次,国产模型真的崛起了!

它给我的感觉,尤其是在代码能力上,已经隐隐超越了Claude4。

关键是价格,国产模型的价格都非常良心,但这次智谱官方放出的GLM-4.5 API价格还是把我惊到了:

输入:2元 / 百万 tokens

输出:8元 / 百万 tokens

 

没有对比就没有伤害,我们来看看Anthropic官方的Claude-4-sonnet的API价格:

输入:$3 / 百万 tokens (约21.5元)

输出:$15 / 百万 tokens (约107.4元)

性能顶级,价格却只有人家的零头。

而且你看看这个生成速度

 

也快了吧。

Claude4,这次是真的再见了

本地的Cluade Code也完全不需要舔着脸去用原生昂贵的Claude模型了,直接上GLM-4.5,又便宜,又强,速度还快!(往后翻,有接入教程和全栈开发实测)

卷吧卷吧,这样我的本地Agent就会越来越NB,哈哈哈~

话不多说,我们Case见真章。

一、GLM-4.5原生模型实测

我们先来看看GLM-4.5模型的原生能力究竟如何。

>/ Case 1. PPT生成

先来个PPT试试

进入z.ai,在对话框下面选中AI PPT(进入PPT模式)

 

prompt:你挑选英雄联盟里面10个英雄,做一个英雄背景介绍PPT,炫酷一点

视频封面

整个PPT太酷炫了,而且每个英雄的图片和介绍都非常准确

下次有机会去演讲啥的,做PPT就用z.ai了

它搜的图是真准,而且配上去毫不违和。

>/ Case 2. AI导诊网站

正好前几天住院,那就让它写一个简单的医院系统吧

太久没进医院了,感觉县城里面医院的流程太繁琐了,感觉真可以搞个AI应用来代替大部分流程。起码问诊那一步,完全可以让AI来,因为我感觉有些问诊的医生还没有大模型的回答专业... 先测试一下它的前端代码能力。

创建一个医疗咨询平台:患者可描述症状、上传病历图片,查看AI诊断建议 。关键功能:症状分析、附近医院地图、用药提醒 。要求:符合HIPAA隐私规范,响应时间<2秒

它先是花了大概几秒思考和规划,然后开始输出代码,真就是疯狂刷屏。

生成速度贼快,不到2分钟,整个项目的代码就生成完毕了

具体效果请看下面的VCR~

完全想不到仅仅是靠大模型原生能力,就能通过几个简短的描述,在短短2分钟左右,生成一个拥有这么多功能的复杂前端网页。

然后它还使用了浏览器自带的localStorage模拟了数据库。

视频封面

这是原生模型一次性生成的,我只能说太强了!

>/ Case 3. 全栈愿望清单

我们也可以先在z.ai上面体验GLM-4.5的全栈开发能力

我想做一个全栈的愿望清单应用。功能要求:能添加新愿望,能展示所有愿望列表,能通过勾选框把愿望标记为‘已实现’,也能删除愿望。

在z.ai首页点击「全栈开发」就可以进入全栈发开模式

 

这个全栈开发是有项目空间来存放生成的前后端代码,包含数据库,目前支持同时存在两个空间(这个空间应该是k8s集群的一个pod,可以随时释放和创建),多了就需要替换。

生成完毕可以点击右上角发布,也可以下载整个项目

 

https://e0rbu6mzsmd1-deploy.space.z.ai

整个网站实现了愿望清单的增删改查,以及未完成清单和完成清单的区分。

视频封面

可以看到视频最后,我新开了一个无痕浏览器,输入愿望清单的网址,进去之后数据是还在的,所以这个是真保存到数据库的数据,否则刷新就会不见了。

我保存的愿望是:三连这篇文章的朋友今年都会暴富,还有愿大家身体健康,万事如意。

哈哈哈,希望都能实现~

>/ Case 4. 全球地震监控

这次没有使用全栈开发模式,里面要求添加一个获取地震数据的API调用

我想创建一个实时全球地震监控地图。请使用Leaflet.js地图库和USGS(美国地质调查局)的实时地震API。在世界地图上,用圆点标记出最近24小时内发生的所有地震。圆点的大小或颜色应该根据震级变化,点击圆点可以弹窗显示地震的详细信息(地点、震级、时间)。页面要精美,然后地图上要明显标注,标注的地点要准确 生成速度也是非常快

效果如下

视频封面

整个网页上的地震标记,还有相关信息,都是从美国地质调查局地震API接口获取的。整个页面交互也非常棒~

二、GLM-4.5接入Claude Code

原生模型已经这么猛了,那要是接上最强开源编程Agent:Claude Code,岂不是要上天?

智谱官方就支持把GLM-4.5一键接入Claude Code框架。

下面是喂饭级接入教程:

第一步:准备工作

先安装Node.js: 确保你的电脑上安装了Node.js,版本号需要大于等于18。

可以在终端输入node -v查看版本。

然后去智谱开放平台(bigmodel.cn)获取apikey

在API密钥页面创建一个新的apikey,并复制保存好。

https://bigmodel.cn/usercenter/proj-mgmt/apikeys

 

API调用地址是: https://open.bigmodel.cn/api/paas/v4/chat/completions

模型名称是:glm-4.5

第二步:安装并配置Claude Code

在终端执行Claude Code安装命令。

npm install -g @anthropic-ai/claude-code

如果遇到权限问题,可以参考我上一篇Claude Code的文章里写的解决方案。

然后配置环境变量,这是最关键的一步。

我们需要让Claude Code把请求发送到智谱的API地址,而不是Anthropic的。

对于Mac/Linux用户:

进入终端执行如下命令

# 设置智谱的API代理地址 export ANTHROPIC_BASE_URL="https://open.bigmodel.cn/api/anthropic"

# 设置你的GLM API Key

export ANTHROPIC_AUTH_TOKEN="你刚刚获取的质谱apikey"

对于Windows用户:

进入PowerShell执行下面的指令

$env:ANTHROPIC_BASE_URL="https://open.bigmodel.cn/api/anthropic" $env:ANTHROPIC_AUTH_TOKEN="你刚刚获取的智谱的apikey"

注意:这个环境变量只在当前终端窗口生效。为了永久生效,需要将这两行命令添加到你的~/.zshrc、~/.bash_profile或Windows的环境变量设置中。

 

第三步:启动

配置好后,在终端输入

claude --dangerously-skip-permissions

这个方式启动可以在后面跑任务的时候畅通无阻(无需人工确认操作)

下面这里选择Yes,proceed

 

看到熟悉的输入框,就代表你成功启动了由GLM-4.5驱动的Claude Code!

 

智谱官方文档接入文档(方式同上):

https://docs.bigmodel.cn/cn/guide/develop/claude

可能有朋友会问,没有配置模型,怎么知道接入的是glm-4.5呢

智谱提供了兼容Anthropic API 的端点: https://open.bigmodel.cn/api/anthropic 这个端点是智谱平台的接口,专门用于配置到各位的Claude Code中。

当Claude Code发起请求时,这个端点会自动将请求转发到智谱的GLM-4.5模型,所以模型这块不用我们管。

接下来,我们上终极挑战,把刚才的AI导诊系统再用Claude Code跑一遍,但这次要求更高。

Prompt:我想做一个AI导诊系统,帮我用Docker在本地启动一个MySQL 8.0服务。然后,为我的AI导诊系统设计数据库表结构,包含'symptoms'和'departments'两张表。写一份详细的后端API文档。最后,基于这份文档,用Node.js+Express写出后端API,并用Vue.js写一个漂亮的、响应式的前端页面,实现完整的导诊流程。项目结构要清晰,给我一个可以运行的完整项目。

 

GLM-4.5驱动的Claude Code展现出了惊人的执行力,大概7分钟左右跑完了。

 

它真的在本地docker中启动了一个MySQL数据库

 

虽然后端服务和前端联调一开始也会有一些bug,但是调整几次之后就ok了。

就这样,一个连接着真实MySQL数据库(它还自己建了表)、包含前后端,并且功能丰富的AI导诊系统就实现了。跟医院的系统风格太像了..

视频封面

不过它存储到数据库的模拟数据有一些是乱码的,视频的最后我也用sql语句查询了MySQL数据库的表,数据是真实存在的,就是显示的时候有点乱码。

另外,我发现智谱还推出了一个50元包月活动,可以无限用GLM-4.5。

Claude Code的重度用户应该知道,Claude Code很费tokens

如果你有大量使用Claude Code的需求,参与这个活动,就能无限畅用GLM-4.5,真的是又快又爽,值得入手。

 

「最后」

说实话,当看到GLM-4.5跑通最后一个复杂项目时,我内心还是挺感慨的。

我期待国产大模型能够真正与国外的顶级模型正面硬刚已经很久了。

这期间,有过惊喜,也有过失望。

而GLM-4.5的出现,让我第一次有了我们真的站起来了的实感。

并且GLM-4.5跟Claude4一样,也是混合推理模型

它不是在某个单点上追平,而是在综合能力、特别是最考验模型的代码和Agent能力上,我体验下来已经隐隐超越Claude4。

更重要的是,它选择了开源,平台也给出了一个极具诱惑力性的API价格。

所以GLM-4.5应该是我后面的最常用模型了

而各大Agent平台、AI IDE肯定也会迅速跟进接入,所有的国内AI应用都将迎来一波质的提升!

国产AI,越来越有盼头了。

能看到这里的都是凤毛麟角的存在!

如果觉得不错,随手点个赞、在看、转发三连吧~

如果想第一时间收到推送,也可以给我个星标⭐

谢谢你耐心看完我的文章~

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐