结果接下来,原本要聊的Agent平台体验分享,草稿在电脑中躺了2周多没有更新,实在惭愧。

仅仅过去两周,AI领域变化真的是日新日异。

比较大的体感:

  • Deepseek推出DeepSeek-OCR 模型,通过光学二维映射技术压缩长文本上下文。这个还没有体验试过。

  • OpenAI推出内置ChatGPT的Atlas浏览器,标志着AI浏览器新时代的到来。我现在写这篇文章就在Atlas上打开的网页进行编写,需要查资料时,可以直接唤醒右上角的chatGPT。

  • 原本的AI编程,也正在从人主导的“氛围式编码”过渡到以 Spec-Kit 和 BMAD 为代表的“规格驱动开发”,让 AI 参与到整个开发流程中。

每次看到这些新进展,都让我感觉还没等把手头的东西研究明白,世界又变了。这种感觉也催促着我,把之前欠的文章还上,否则很快就成了“古董”。

所以,言归正传。

我在搭建智能体探索的平台清单如下。接下来,我也会按这个顺序分享下,每个平台使用下来的体验。

序号 平台名称 所属公司/团队
1 Dify LangGenius
2 Coze 字节
3 豆包 字节
4 腾讯元器 腾讯
5 文心智能体平台 百度
6 通义 阿里
7 智谱清言 智谱AI
8 讯飞星辰Agent平台 科大讯飞
9 纳米 360

整个过程先从Dify开始,因为Dify跟公司现有在用的搭建平台近似,并且Dify为开源的,你可以选择单独部署,也可以就在dify.ai官网上搭建。

Dify可以创建五种类型的智能体,基本也是当下流行的几种方式。所以我把智能体类型这部分,上挪到大纲这里来表述。

类型 复杂度 核心区别
聊天助手 只会根据你给的信息,限定范围与内容聊天。
文本生成应用 ☆☆ 你下令,它写作,一次性完成。
工作流 ☆☆☆ 像流水线,自动化处理一串固定任务。
Chatflow ☆☆☆☆ 你设计好对话剧本,AI照着剧本跟你聊。
Agent ☆☆☆☆☆ 你提目标,AI自己想办法、找工具去完成。

Dify

https://cloud.dify.ai/

Dify由LangGenius公司推出,该公司由前腾讯云DevOps团队成员创立。

注册后,选择「创建空白应用」,选择应用类型(就是上面已说明的5种)。

选择Agent类型,进入页面后就是这样一个布局。可以添加:提示词、变量、知识库、工具(平台自带或自己发布成工具的workflow agent、或mcp工具。)

因为我做的是语音对话应用,所以体验,我很注重每个平台语音输入能力。

Dify web端支持语音输入,但是需要操作两下:点击语音输入,关闭语音输入。

移动端H5页面同样问题,在当前都是按住说话,松开自动发送的时代,Dify的语音输入,操作实在太繁琐了。

Dify几乎不收费,自带了文字语音互转能力,模型也有一定免费额度,也可以自己接入大模型API key。

Dify整体还是偏向开发者使用,也可以将做好的Agent发布成API,供第三方调用。

对普通用户来说,它的界面与操作流程,并没有十分友好。

Coze

https://www.coze.cn/studio

Coze是字节推出的,和Dify是之前知名度最高的两个Agent搭建平台。

注册进入开发平台后,可以选择「创建智能体」或「创建应用」。

创建智能体就是我们本次要使用的功能。

这份完整版的大模型 AI 学习和面试资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
在这里插入图片描述

Coze的Agent搭建页面,支持非常丰富的扩展,除了传统提示词、可添加知识库、工具(Coze中称为插件)外,可以添加聊天背景图,选择音频的语言和音色等。

并且web端就支持,按住空格说话,松开自动发送。这一点真的点赞。其它Agent搭建平台,对于web端音频输入,都没有处理到这样的细节。

Coze可以把做好的智能体,发布到扣子应用商店、豆包、微信体系、API等。

创建应用相当于可以通过拖拉拽或低代码方式组装用户页面或流程,不在我们本次重度体验的流程,暂且不表。

Coze的问题在于:免费版只有500资源点/天。资源点是官方设定的一个虚拟单位来衡量和消耗服务用量。

基本上调用模型对话100句左右,免费的资源点就消耗完了。为了体验完整能力,我做测试的时候,付费了10块钱,买了30000资源点。

Coze最贵的不是调用模型的消耗,而是文字语音互转的消耗。可以看到我做Agent测试,几轮对话下来,调用模型花费才39资源点,但是官方语音合成上消耗是480+的资源点,是模型使用的12倍。

这么一看,用Coze做这个小学口语陪伴Agent,如果使用很高频还是会有一定成本,所以没有把它放到第一位来考虑。

豆包

https://www.doubao.com/chat/bot/discover

豆包应该是大家最熟悉的AI应用之一,完全面向C端。官方自带的功能与服务已经很强了。

我的上篇文章有朋友留言,为什么不直接用豆包?

我当时发现Dify、Cozy都不合适,第三个想到的就是豆包。

豆包App/Web端搭建智能体的方式,完全一致,都很简单。能搭建的就是我们开篇5类中的第1类Agent:聊天助手。

它的问题是:提示词输入的字数很有限,我把我的提示词copy进去,它会自动截取掉。无明确限制字符数量的提示。

创建完智能体后,豆包APP端是可以做一些额外的配置。添加到桌面、选择语言和音色,豆包的声音选择是最丰富的,音高、语速都可以灵活调节。

同时生成的应用,也可以模拟通话模式,一直监听语音输入,模拟实时对话效果。

因提示词支持输入的长度不够,我又不想挂载一个知识库,把小学三年级的英语知识,偷懒都写到提示词中了。这个时候提示词字数有限制,就导致无法按我的想法实施。

同时,后面我想让这个Agent可以通过英语对话生图,发现豆包自己搭建的Agent做不到这一点。就同样放弃用豆包做这个Agent。

腾讯元器

https://yuanqi.tencent.com/

腾讯元器是腾讯官方推出的智能体搭建平台。

很讨巧的定义了一个「公众号智能体」,最大的特点是,可以便捷拉取公众号文章构建知识库,一键发布到公众号后台,进行公众号智能回复。

当然这也很好理解了,毕竟都是腾讯自己后台的数据…

搭建对话式智能体,就是我们说的聊天助手。元器的后台很简单,就是常规的:提示词、知识库、工作流,没有太多特点。

最大的特点,可能就是提示词支持到2w字符,对于搭建生成文案要求比较复杂的场景,有一定支撑。

支持发布的渠道,就是腾讯自家的领地了。

腾讯元器web端编辑后台,直接不支持语音输入,又没有移动APP端,相当于我做了也无法在手机上使用,放弃。

文心智能体平台

https://agents.baidu.com/

文心智能体平台是百度推出的智能体搭建平台。

文心智能体平台,中规中矩。提示词支持输入3000字符,支持插件、工作流、数据库、声音,这些跟Coze有些相似。

细节没有Coze做得好,编辑页也不支持语音输入。

可发布的平台是我最疑惑的,支持发布小米商店、微信系或API访问。但没有看到任何直接发布到百度系应用的方式。

我以为搭建好的智能体是用百度的AI应用APP:文小言,访问使用。结果发现搜不到。通过应用商店搜索「文心智能」相关关键词,也没有对应的移动APP,看来两个Agent体系并不通用。

好吧,我又把做好的Agent的,通过web端的二维码在手机页面打开,发现连语音输入都不支持。

看来文心智能也不是我的菜。

PS:后面我又通过百度的「文小言」APP来创建智能体。文小言是直接可以对话生图的,语音输入与播报都不错。

但生图后可以跳转修图或生成视频去,对于我的场景,我担心孩子注意力被这些吸引过去,没有放在原本的口语练习上。

加上文小言可添加的提示词有限,我把提示词copy进去会自动截断。同时不支持选模型,不知道官方提供的是哪个模型能力,实际对话一直跟我说中文。

综合上面的情况,文小言APP我也放弃使用了。

通义

https://www.tongyi.com/discover

通义是阿里系的智能体搭建平台。

阿里的Qwen模型最近能打不少,Agent平台却相对比较简陋,如果不展开高级设置,和豆包的创建智能体页面很像。

好消息是:我想不添加任何工具,就能支持的文生图功能直接就有!

坏消息是:提示词只支持1000字符,相当于我要把提示词砍掉四分之三;并且web端也不支持语音输入,没有声音选择。

移动端的话,其实功能上都没问题,能生图、能语音对话、又与豆包一样支持语音通话。

核心问题还是:因为提示词太少了,所以AI无法准确按我的构想回答问题。不满足我的需求,所以Pass。

智谱清言

https://chatglm.cn

哈哈,智谱是我整体体验下来,最满意的一个智能体搭建平台。

我在上篇文章《为了给儿子做个AI口语陪伴,我把国内的Agent平台都玩了个遍》,基本已经简述了其中的原因。

考虑到读者不需要跳转过去,我在这里再啰嗦两句。

智谱的web端智能体搭建页面,最好的三个特点:

  1. 提示词4096个字符,我这个Agent够用;

  2. 不需要添加任何额外的工具,能支持AI绘图,对大众用户就很友好;

  3. 支持声音,虽然支持的音色很少,但是可以自己在移动端录制上传。

PS:上篇文章有朋友留言,反馈选择最新的4.5、4.6模型,提示词目前支持到12000字,看了下,确实已经支持到12000字,点赞。

其它的支持工作流、插件(工具),基本和主流的Agent平台一致,web端编辑页面同样也不支持语音输入。

移动端可以将智能体创建到桌面,这样就保证孩子每次点开图标,可以直接跟Peter对话。

我在上篇文章也提到:我之所以选择智谱,并不是智谱的模型有多强。这个简单的Agent,本身对模型的底层能力要求并不高。

在整个探索过程,我也完全没有想到最后会用智谱清言搭建,但它确实是我的这个场景,短板最少,整体体验最好的。

讯飞星辰Agent平台

https://agent.xfyun.cn/home

讯飞星辰Agent平台,是科大讯飞推出的。

创建Agent时,提示词都能复制进去,没有具体的字符长度说明,但是保存会报错。

实际还是要缩减提示词,有点伤心,为什么不复制进去就告诉我。

但我发现讯飞星辰的高级设置里面,是可以设定角色人设的。

可以将提示词中角色人设的文字部分放到这里,这样提示词可以进一步压缩,满足官方的字数限制。

并且讯飞星辰也直接就支持AI生图。移动端APP也支持将Agent添加到桌面。

这就代表理论上,它能达到和我使用智谱清言做的,是一个效果。

但问题在于APP端不支持直接语音输出,必须要点一下那个小喇叭按钮,这样就会导致很繁琐,总不能让孩子每次去点一下。

然后我点击,或重新开启一轮对话再点击,都会提示:本对话暂不支持语音播报,使我十分困惑。只好Pass。

纳米

https://www.n.cn/

纳米是360推出的智能体搭建平台。

比较简单,支持功能并不丰富。不支持语音输入,没有声音选择。

可以添加知识库,虽然没有工具或插件添加,但是可以添加MCP工具,但我点击没有反应。不知道是不是我没研究明白。

提示词支持,没看到有限制,都能保存成功。

实际APP端可以语音输入,对话效果也还可以,但是没法生图,所以也就此放弃。

总结

好了,以上是记录每个平台比较简短的体验过程,没想到也已经快5000字了。

其实我整理了一个excel表格,但是手机屏幕太窄,放上来体验很不好。我让AI帮生图,目前完全把表格文字能准确呈现的模型,还没有看到(期待Gemini 3.0)。

所以退而求其次,让AI根据表格内容,编写了一个html页,倒也能看。

0基础怎么入门AI大模型?

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习和面试资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
在这里插入图片描述

在这里插入图片描述

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

在这里插入图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

在这里插入图片描述

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

在这里插入图片描述

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐