1 前言

前段时间我们分享了「个人用户」可以通过心流的开放平台,免费调用国内先进大模型的方法。

参见:《白嫖 Kimi-K2、Qwen3-Max、DeepSeek-V3.2 等国内顶尖大模型!保姆级教程,普通人也能用!》

很多朋友已经用起来了,而且反馈还不错。

有朋友反馈,虽然免费,但只支持 1 个并发,而且速度慢了一些。

今天给大家介绍一个使用火山引擎,白嫖 50 万 tokens 的方式,而且响应速度更快。

如果你加入「协作奖励计划」的话,每天会给 50 万 tokens,免费使用。

2 实践

2.1 开通模型

开通管理:https://console.volcengine.com/ark/region:ark+cn-beijing/openManagement?LLM=%7B%7D&OpenModelVisible=false

我们需要在「开通管理」页面开通我们想要使用的模型。

你也可以全选,然后勾选自动开通新模型。

这样未来有新的模型时,就可以直接使用,不需要手动开启。

如果你第一次使用的话,需要实名认证。

2.2 创建推理接入点

在线推理页面:https://console.volcengine.com/ark/region:ark+cn-beijing/endpoint?config=%7B%7D

填写接收点的名称和描述,选择想要使用的模型,点击创建就可以了。

填写基本信息,选择这个接入点想要使用的模型。

选择接入方式一般选第一个,然后创建接入点就可以了。

有些同学可能会好奇,直接输入模型名称不就行了吗?为什么要创建接入点呢?

其实同样的模型可以创建不同的接入点,每个接入点可以灵活地调整资源(如随时可以关闭、限流等)、监控运行状况。

2.3 加入协作奖励计划

如果你不加入这个计划的话,每个模型只送 50万 tokens,用完扣费。

加入协作奖励计划,个人用户每日单模型 50万 tokens 免费。

这个比较适合没有太多隐私的场景,如果很你在意数据隐私,不要开启。

入口在火山引擎控制台-开通管理:https://console.volcengine.com/ark/region:ark+cn-beijing/openManagement

简单来说,你贡献数据,企业免费提供大模型服务,采集的数据会进行加密和匿名化处理后被使用。

详情参考:https://www.volcengine.com/docs/82379/1391869?lang=zh

点击立即参加,可以选择授权的模型,然后在右侧选择授权的接入点。

这里只会采集你授权的接入点。

没有授权的接入点,是不会采集数据,也不发放免费的奖励包。

在这里也可以看到今天已经采集了多少 tokens。

你可以点击「撤回授权」来取消这个模型的数据协作。

在「在线推理」里可以清楚地看到哪些接入点加入了协作奖励计划。

进入单个接入点,如果是加入「协作奖励计划」,我可以看到上面的采集信息,也可以在这里取消计划。

2.4 使用

我们申请完了之后,就可以在需要使用大模型的软件里配置,使用啦。

比如「代体」AI 语音输入法:告别错别字和退格键!这款AI语音输入法,让你的打字效率倍增(含实测体验)

在 Cherry Studio 中设置「火山引擎」,这里也可以添加前面的接入点使用。

配置好之后就可以正常使用了。

如果想用 Cherry Studio 创建智能体的话,可以参加我的另外一篇公众号文章:

我的“AI学习军团”揭秘:一套提示词帮你搞定概念理解、通俗解释、速记口诀和专业图解

3 写在最后

推荐火山引擎的重要原因是,字节出品品质有保障,速度还是非常快的。

不介意隐私的场景,可以采用「数据协作计划」每天免费使用 50W tokens。

注意:活动 2025年11月30日截止。

如果你很在意隐私的话,超过了赠送的额度,自己花钱也可以,其实并不算很贵。

相信未来有一天个人笔记本也可以部署一些效果能够达到现在很多满血版国内先进大模型的水平的模型。

那个时候,速度、成本、隐私安全问题能够得到更好地解决, AI 也会迎来新一轮的大爆发。


如果你认为文章对你有帮助,欢迎关注我的 CSDN 账号和微信公众号 “ 悟鸣AI ”(见下方↓),一起跟上 AI 发展步伐。

在这里插入图片描述

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐