1.前言

在AI辅助编程工具快速发展的今天,Claude Code、Cursor等工具已经成为开发者的得力助手。然而,这些工具背后的大模型API调用费用往往是一笔不小的开销,特别是对于个人开发者和小团队来说,如何低成本甚至免费使用高质量的大模型API成为了大家关注的焦点。好消息是,英伟达悄悄给我们送了一份大礼!

NVIDIA NIM(NVIDIA Inference Microservices)是英伟达推出的推理服务平台,最近悄悄上线了两个非常火爆的国产模型:智谱GLM-4.7和MiniMax M2.1。这两个模型不仅完全免费调用,而且API兼容OpenAI格式,意味着现有代码基本不用改。其中MiniMax-M2是一个混合专家(MoE)模型,总参数量高达2300亿,活跃参数100亿,特别擅长多文件编辑、代码运行修复等编程任务;而GLM-4.7在数学推理方面以95.7%的成绩遥遥领先,两者各有所长,搭配使用效果更佳。

1768839339068

这2天英伟达免费提供GLM-4.7和MiniMax M2.1的消息非常火爆,今天我们就手把手教大家如何通过CLIProxyAPI实现协议转换,让这些免费模型能够在Cherry Studio和Claude Code中完美使用,体验和感受一下这些国产大模型在实际开发中的强大能力。

2.部署实战

英伟达模型获取

我们首选需要登录英伟达提供的地址https://build.nvidia.com/

image-20260119214414801

没有账号的可以注册一下,具体注册就不做详细展开了。(我之前已经注册过了 )

完成注册后我们随便选一个模型

image-20260119214827068

点击模型进入模型选择。我点击右上角“view code ”

image-20260119214933015

打开代码后,会显示API Request的代码,这个代码包含python、Lanchain、node 、shell 我们点击生成apikey ,这样我们就拿到如下图的三个值base_url 、api_key 、model。记住前面2个值。

image-20260119215227555

通过上面的方式我们就拿到模型客户端调用三个最关键的东西了,有的人说,你不是minimaxai/minimax-m2.1 和glm4.7 模型吗?怎么弄了个nvidia/nemotron-3-nano-30b-a3b 模型,这个不重要。重要的是我们拿到apikey 和base_url

CLIProxyAPI反代

接下来我们一个叫做CLIProxyAPI的工具来实现英伟达API 模型的反代。为什么需要这步操作呢?因为默认的接口是支持openai的接口。我们接下来使用的是claude code 需要将openai接口适配转换成ANTHROPIC的接口。所以我们需要借助CLIProxyAPI这个工具实现模型接口协议转换。

关于CLIProxyAPI 项目的部署,这块就不做详细展开,之前给大家使用google Antigravity(反重力)的时候详细介绍过CLIProxyAPI工具的部署和使用。不清楚的小伙伴可以看我之前的文章《白嫖Google Antigravity!Claude Opus 4.5免费用,告别token焦虑》,接下来我们重点介绍英伟达API 模型在CLIProxyAPI配置。

打开部署好的CLIProxyAPI 后台管理平台。比如我的是https://cliproxyapi.duckcloud.fun/management.html

image-20260119220247209

点击api提供商,我们把鼠标拉到最下方找到OpenAI 兼容提供商,点击“添加提供商”

image-20260119220405513

我们配置一下Base URL、模型列表、API密钥

image-20260119220516762

image-20260119220557678

点击保存。完成模型设置,这里模型我们填写2个国内的模型(z-ai/glm4.7、minimaxai/minimax-m2.1)这样我们就完成了模型配置和协议转换了。

另外再配置管理中增加下面的代码,避免遇到400报错

image-20260119220825472

代码如下

payload:
  override:
    - models:
        - name: "z-ai/glm4.7" # 精确匹配你的模型名
          protocol: "openai"
        - name: "minimaxai/minimax-m2.1" # 精确匹配你的模型名
          protocol: "openai"          
      params:
        "reasoning_effort": "high"

通过以上方式我们就完成了模型的设置。

配置添加newapi(这步可以不要)

接下来我们在把上面的CLIProxyAPI api请求接口添加到我自己搭建的newapi 这个中间代理服务中,这样的好处在于方便监控和管理。当然CLIProxyAPI 本身也是有监控和管理的,但是功能相对比较弱。

image-20260119221246261

上面的图是CLIProxyAPI 监控管理功能,可以看到我这里查看到之前使用google Antigravity 和glm4.7模型的消耗。

接下来我们登录newapi 在渠道管理中添加新的渠道。

image-20260119221458213

点击添加渠道,类型这里我们选择anthropic claude ;名称随便起一个,填写CLIProxyAPI 秘钥以及CLIProxyAPI 请求地址

image-20260119221613954

有的小伙伴会问这个秘钥是什么呢?这里的KEY 是你在CLIProxyAPI 配置对外的自定义KEY

image-20260119221820607

接下来我们添加模型,如果CLIProxyAPI 到底提供多少模型,不清楚的可以点击“获取模型” 列表中选择添加

image-20260119221901910

获取模型列表

image-20260119222047721

这里系统自动调出我们之前自定义添加的2个模型之外(z-ai/glm4.7、minimaxai/minimax-m2.1)还把我在CLIProxyAPI 提供的其他模型一并调用出来.选择模型之后,点击保存即可。

3.第三方平台使用

接下来我们就可以在第三方平台上使用者这个免费的反代理API 了

cherry stuido

我们使用cherry stuido 这个第三方工具来测试验证一下反带的效果。

我们先在cherry stuido配置一下

image-20260119222542921

填写api秘钥 api地址 我们填写本地地址http://115.190.165.156:3000

image-20260119222656373

​ 以上我们就完成了模型基本设置。

​ 有的小伙伴又会问了,上面的api key 又是什么呢? 这里我们使用是new api 自然是new api 分配的api key

 c

上述配置完成后,我们在cherry studio中使用。

接下来我们在聊天对话中验证测试

​ 选择z-ai/glm4.7

image-20260119223029797

这里我们也可以在newapi中查找到调用的记录

image-20260119223140858

通过new api我们就非常方便监控到调用情况。当然你也可以在它的上游CLIProxyAPI 管理端找到调用

image-20260119223342119

大家有没有发现虽然记录了模型调用但是没有上面new api直观。

claude code 使用

接下来我们使用本地claude code 来实现。这里配置我们使用cc-switch配置。关于cc-switch配置 配置不熟悉的可以看我之前的文章

CC-Switch配置切换神器:5秒搞定多设备同步,坚果云让配置永不丢失

image-20260119223500575

image-20260119223535288

cc-switch完成后,我们启动本地claud code

image-20260119223621889

我们验证测试一下

image-20260119223648210

OK 默认使用了minimaxai/minimax-m2.1模型来运行的。

通过上面的配置我们就使用英伟达免费提供的minimax-m2.1 和智普glm4.7模型了,呵呵是不是挺爽的。

4.总结

今天主要带大家了解并实现了英伟达NIM平台免费提供的GLM-4.7和MiniMax M2.1模型在Claude Code和Cherry Studio中的完整接入流程,该方案以"NVIDIA NIM免费API + CLIProxyAPI协议转换"为核心优势,结合国内开发者低成本使用大模型API的需求,通过英伟达开发者平台与CLIProxyAPI反代工具,形成了一套从API获取到多平台调用的全链路免费大模型使用方案。

通过这套实践方案,小伙伴们能够高效突破大模型API高昂费用的限制——借助英伟达NIM平台注册获取API Key(包括访问build.nvidia.com、选择模型、生成nvapi-开头的密钥),无需任何付费订阅,就能快速接入智谱GLM-4.7和MiniMax M2.1这两个国产顶级大模型(如本次演示的Claude Code免费调用)。无论是日常代码编写、多文件编辑,还是数学推理、复杂工具链调用,都能通过CLIProxyAPI的OpenAI到Anthropic协议转换完成,极大降低了AI辅助开发的使用门槛和成本。

感兴趣的小伙伴可以按照文中提供的步骤进行实践,根据实际开发需求调整模型选择和配置参数。今天的分享就到这里结束了,我们下一篇文章见。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐