最强开源模型深夜爆火!GLM-4.5接入Claude Code直接起飞~
【国产大模型GLM-4.5实测体验:性能比肩Claude4,价格仅零头】 智谱AI最新开源的GLM-4.5模型采用混合专家架构,包含3550亿和1060亿参数两个版本,在12项权威评测中斩获全球第三、国产第一的成绩。实测显示其代码生成能力已超越Claude4,2分钟内可完成复杂医疗咨询平台开发,并能无缝接入ClaudeCode框架。相比Claude4高昂的API费用(输入21.5元/百万token
大家好,我是袋鼠帝。
AI圈卷已经说累了,最近不是在跑Case,就是在找Case的路上...
昨晚被智谱的GLM-4.5刷屏了,很多人都在讨论。
GLM-4.5是他们的新一代旗舰模型而且,它又又又是开源的!
智谱还发了50块包月爽玩券(领取方式放最后了),所以,我忍不住第一时间就上手测试了。
采用混合专家(MoE)架构,包含两个版本:
GLM-4.5: 3550亿总参数,320亿激活参数。
GLM-4.5-Air: 1060亿总参数,120亿激活参数。
跟Claude4一样是混合推理模型(推理/非推理)
两个版本全部在Hugging Face和ModelScope上开源,并且遵循最宽松的MIT协议。
定位是专为智能体(Agent)应用打造的基座模型,原生融合了推理、代码、Agentic能力。
在MMLU Pro、MATH等12个权威基准综合评测中,拿下了全球第三、国产第一、开源第一的好成绩!
不测不要紧,当我测完第一个Case,我立马就来精神了(龙马精神!)
对于智谱这次的新旗舰模型,我只能说,这次,国产模型真的崛起了!
它给我的感觉,尤其是在代码能力上,已经隐隐超越了Claude4。
关键是价格,国产模型的价格都非常良心,但这次智谱官方放出的GLM-4.5 API价格还是把我惊到了:
输入:2元 / 百万 tokens
输出:8元 / 百万 tokens
没有对比就没有伤害,我们来看看Anthropic官方的Claude-4-sonnet的API价格:
输入:$3 / 百万 tokens (约21.5元)
输出:$15 / 百万 tokens (约107.4元)
性能顶级,价格却只有人家的零头。
而且你看看这个生成速度
也快了吧。
Claude4,这次是真的再见了
本地的Cluade Code也完全不需要舔着脸去用原生昂贵的Claude模型了,直接上GLM-4.5,又便宜,又强,速度还快!(往后翻,有接入教程和全栈开发实测)
卷吧卷吧,这样我的本地Agent就会越来越NB,哈哈哈~
话不多说,我们Case见真章。
一、GLM-4.5原生模型实测
我们先来看看GLM-4.5模型的原生能力究竟如何。
>/ Case 1. PPT生成
先来个PPT试试
进入z.ai,在对话框下面选中AI PPT(进入PPT模式)
prompt:你挑选英雄联盟里面10个英雄,做一个英雄背景介绍PPT,炫酷一点
整个PPT太酷炫了,而且每个英雄的图片和介绍都非常准确
下次有机会去演讲啥的,做PPT就用z.ai了
它搜的图是真准,而且配上去毫不违和。
>/ Case 2. AI导诊网站
正好前几天住院,那就让它写一个简单的医院系统吧
太久没进医院了,感觉县城里面医院的流程太繁琐了,感觉真可以搞个AI应用来代替大部分流程。起码问诊那一步,完全可以让AI来,因为我感觉有些问诊的医生还没有大模型的回答专业... 先测试一下它的前端代码能力。
创建一个医疗咨询平台:患者可描述症状、上传病历图片,查看AI诊断建议 。关键功能:症状分析、附近医院地图、用药提醒 。要求:符合HIPAA隐私规范,响应时间<2秒
它先是花了大概几秒思考和规划,然后开始输出代码,真就是疯狂刷屏。
生成速度贼快,不到2分钟,整个项目的代码就生成完毕了
具体效果请看下面的VCR~
完全想不到仅仅是靠大模型原生能力,就能通过几个简短的描述,在短短2分钟左右,生成一个拥有这么多功能的复杂前端网页。
然后它还使用了浏览器自带的localStorage模拟了数据库。
这是原生模型一次性生成的,我只能说太强了!
>/ Case 3. 全栈愿望清单
我们也可以先在z.ai上面体验GLM-4.5的全栈开发能力
我想做一个全栈的愿望清单应用。功能要求:能添加新愿望,能展示所有愿望列表,能通过勾选框把愿望标记为‘已实现’,也能删除愿望。
在z.ai首页点击「全栈开发」就可以进入全栈发开模式
这个全栈开发是有项目空间来存放生成的前后端代码,包含数据库,目前支持同时存在两个空间(这个空间应该是k8s集群的一个pod,可以随时释放和创建),多了就需要替换。
生成完毕可以点击右上角发布,也可以下载整个项目
https://e0rbu6mzsmd1-deploy.space.z.ai
整个网站实现了愿望清单的增删改查,以及未完成清单和完成清单的区分。
可以看到视频最后,我新开了一个无痕浏览器,输入愿望清单的网址,进去之后数据是还在的,所以这个是真保存到数据库的数据,否则刷新就会不见了。
我保存的愿望是:三连这篇文章的朋友今年都会暴富,还有愿大家身体健康,万事如意。
哈哈哈,希望都能实现~
>/ Case 4. 全球地震监控
这次没有使用全栈开发模式,里面要求添加一个获取地震数据的API调用
我想创建一个实时全球地震监控地图。请使用Leaflet.js地图库和USGS(美国地质调查局)的实时地震API。在世界地图上,用圆点标记出最近24小时内发生的所有地震。圆点的大小或颜色应该根据震级变化,点击圆点可以弹窗显示地震的详细信息(地点、震级、时间)。页面要精美,然后地图上要明显标注,标注的地点要准确 生成速度也是非常快
效果如下
整个网页上的地震标记,还有相关信息,都是从美国地质调查局地震API接口获取的。整个页面交互也非常棒~
二、GLM-4.5接入Claude Code
原生模型已经这么猛了,那要是接上最强开源编程Agent:Claude Code,岂不是要上天?
智谱官方就支持把GLM-4.5一键接入Claude Code框架。
下面是喂饭级接入教程:
第一步:准备工作
先安装Node.js: 确保你的电脑上安装了Node.js,版本号需要大于等于18。
可以在终端输入node -v查看版本。
然后去智谱开放平台(bigmodel.cn)获取apikey
在API密钥页面创建一个新的apikey,并复制保存好。
https://bigmodel.cn/usercenter/proj-mgmt/apikeys
API调用地址是: https://open.bigmodel.cn/api/paas/v4/chat/completions
模型名称是:glm-4.5
第二步:安装并配置Claude Code
在终端执行Claude Code安装命令。
npm install -g @anthropic-ai/claude-code
如果遇到权限问题,可以参考我上一篇Claude Code的文章里写的解决方案。
然后配置环境变量,这是最关键的一步。
我们需要让Claude Code把请求发送到智谱的API地址,而不是Anthropic的。
对于Mac/Linux用户:
进入终端执行如下命令
# 设置智谱的API代理地址 export ANTHROPIC_BASE_URL="https://open.bigmodel.cn/api/anthropic"
# 设置你的GLM API Key
export ANTHROPIC_AUTH_TOKEN="你刚刚获取的质谱apikey"
对于Windows用户:
进入PowerShell执行下面的指令
$env:ANTHROPIC_BASE_URL="https://open.bigmodel.cn/api/anthropic" $env:ANTHROPIC_AUTH_TOKEN="你刚刚获取的智谱的apikey"
注意:这个环境变量只在当前终端窗口生效。为了永久生效,需要将这两行命令添加到你的~/.zshrc、~/.bash_profile或Windows的环境变量设置中。
第三步:启动
配置好后,在终端输入
claude --dangerously-skip-permissions
这个方式启动可以在后面跑任务的时候畅通无阻(无需人工确认操作)
下面这里选择Yes,proceed
看到熟悉的输入框,就代表你成功启动了由GLM-4.5驱动的Claude Code!
智谱官方文档接入文档(方式同上):
https://docs.bigmodel.cn/cn/guide/develop/claude
可能有朋友会问,没有配置模型,怎么知道接入的是glm-4.5呢
智谱提供了兼容Anthropic API 的端点: https://open.bigmodel.cn/api/anthropic 这个端点是智谱平台的接口,专门用于配置到各位的Claude Code中。
当Claude Code发起请求时,这个端点会自动将请求转发到智谱的GLM-4.5模型,所以模型这块不用我们管。
接下来,我们上终极挑战,把刚才的AI导诊系统再用Claude Code跑一遍,但这次要求更高。
Prompt:我想做一个AI导诊系统,帮我用Docker在本地启动一个MySQL 8.0服务。然后,为我的AI导诊系统设计数据库表结构,包含'symptoms'和'departments'两张表。写一份详细的后端API文档。最后,基于这份文档,用Node.js+Express写出后端API,并用Vue.js写一个漂亮的、响应式的前端页面,实现完整的导诊流程。项目结构要清晰,给我一个可以运行的完整项目。
GLM-4.5驱动的Claude Code展现出了惊人的执行力,大概7分钟左右跑完了。
它真的在本地docker中启动了一个MySQL数据库
虽然后端服务和前端联调一开始也会有一些bug,但是调整几次之后就ok了。
就这样,一个连接着真实MySQL数据库(它还自己建了表)、包含前后端,并且功能丰富的AI导诊系统就实现了。跟医院的系统风格太像了..
不过它存储到数据库的模拟数据有一些是乱码的,视频的最后我也用sql语句查询了MySQL数据库的表,数据是真实存在的,就是显示的时候有点乱码。
另外,我发现智谱还推出了一个50元包月活动,可以无限用GLM-4.5。
Claude Code的重度用户应该知道,Claude Code很费tokens
如果你有大量使用Claude Code的需求,参与这个活动,就能无限畅用GLM-4.5,真的是又快又爽,值得入手。
「最后」
说实话,当看到GLM-4.5跑通最后一个复杂项目时,我内心还是挺感慨的。
我期待国产大模型能够真正与国外的顶级模型正面硬刚已经很久了。
这期间,有过惊喜,也有过失望。
而GLM-4.5的出现,让我第一次有了我们真的站起来了的实感。
并且GLM-4.5跟Claude4一样,也是混合推理模型
它不是在某个单点上追平,而是在综合能力、特别是最考验模型的代码和Agent能力上,我体验下来已经隐隐超越Claude4。
更重要的是,它选择了开源,平台也给出了一个极具诱惑力性的API价格。
所以GLM-4.5应该是我后面的最常用模型了
而各大Agent平台、AI IDE肯定也会迅速跟进接入,所有的国内AI应用都将迎来一波质的提升!
国产AI,越来越有盼头了。
能看到这里的都是凤毛麟角的存在!
如果觉得不错,随手点个赞、在看、转发三连吧~
如果想第一时间收到推送,也可以给我个星标⭐
谢谢你耐心看完我的文章~
更多推荐
所有评论(0)