今年WAIC(世界人工智能大会)已经结束了,以艾哥所知的情况来看,今年大家最关注的毫无疑问还是机器人。

虽然这群硅基生命在经历了一年的沉淀之后,依旧保留着碳基人类所缺少的那种小脑缺失的美感。(bushi)

img

像这种机器人打麻将很有噱头,但作为打工人,依然记得去年横空出世的DeepSeek对我等牛马的贴心呵护。

但到了今年,将大模型与场景绑定更深的、生产力落地的Agent,就成为了兵家必争之地。

img盲猜应该有朋友还不知道Agent是什么,简单来说就是一个基于AI大模型构建的,能够完成具体事情的智能体。

相比于大模型需要我们主动去输入指令,一步一步获取信息达到目的,Agent的好处在于你只用给出一个目标,过程它会自己去琢磨**,**你只用坐等一个结果就好了。

img

是不是感觉很眼熟,这不就外包嘛!

作为天天一线搬砖的牛马,Agent代表的生产力解放是艾哥最馋的,而当下市面上的Agent产品,虽然不能说很多,但头部的厂商基本都已经下场。

目前市面上体量比较大的通用Agent像Manus(已经退出中国市场)、通义千问、kimi、MinMax Agent(面向海外)、扣子空间、夸克AI、纳米AI都已经趋于成熟。

艾哥今天就浅捞了扣子空间、通义千问和kimi智能体三个Agent来试试,看看能不能帮我完成日常工作。

首先声明,测试结果仅为艾哥以特定目的为前提的纯主观感受,并不代表Agent的综合能力,建议大家亲自体验之后再做判断。

以及还有更多诸如Manus、MinMax Agent、Genspark等优秀的Agent,但考虑到成本问题这次暂时搁置,如果大家想看我们之后再测。

img

PPT制作

作为最容易出“成果”的工作内容,各位牛马估计对PPT又爱又恨。

如果给“最想外包出去的活”做个排名,艾哥大概会把PPT放在第一个。

于是,艾哥首先让三个Agent给我做了一个**“理想i8发布会PPT”**,直接来看效果。

表现最好的是扣子空间,在我提出要求之后,扣子有明显的步骤思考,比如先确定理想i8的产品信息;

img

然后又搜索了i8的设计细节、竞品情况等;

img

最后给到一个大纲让我确认。

因为是测试,所以我没有做任何调整,扣子给我的PPT风格确认中,也直接选择了智能选择。

img

大概等了9分钟之后,扣子给到了一份理想i8发布会PPT。

说实话,扣子输出的PPT和真正的发布会PPT还是有一定差距的。

img

但考虑到全程我只给了一句话,其余什么干涉都没有,全靠扣子自己扒拉素材,甚至用有限的素材给我整了个配色方案和车内空间设计。

img

就这效果,日常拿来糊弄应该问题不大的。(扣子也是三个里面唯一自己找了i8相关配图的Agent)

不过理想发布会昨晚就已经开过了,扣子搜到的素材还是早期的爆料图,信息检索方面还有待进步啊。

接下来是通义千问。(PS:通义千问也有自己的PPT智能体)

img

在我提出要求之后,千问非常快速(不超过5s)的生成了一个大纲,我们可以在大纲里自行删减。

下方可以选择PPT风格,但没有扣子空间那样的智能选择,必须自己确定模板

img

等都确定好之后点击下一步就可以生成得到一个PPT。

从结果来看,通义千问生成的PPT更加模板化,艾哥感觉就是将生成的大纲直接塞进了PPT模板里。

img

img

模板和内容之间没有逻辑关系,产品细节也缺失,图片只能选择自己上传或者AI生成,相比扣子有点呆。

img

如果要使用通义生成的内容,艾哥感觉少不了自己返工。

Kimi的表现和通义千问差不太多,都是根据要求直接生成大纲,但不支持修改,模板也需要自己确定。

img

成品也是PPT模板+大纲的拼接,但相比通义千问,有着更浓郁的毛坯房的味道。

PPT这一趴,扣子完胜。

img

内容检索和总结

做完PPT,艾哥决定让三位帮我进行内容信息检索和总结。

我提出的要求是:检索微信公众号上关于WAIC 2025热门话题,总结主要观点并输出成PDF文件。

扣子在经过了7轮思考之后,期间自主调动了LinkReaderPlugin等工具辅助验证,终于确定没有办法锁定公众号来源

img

最终扣子给了我一份不限平台的WAIC热点总结。

img

img从内容来看,扣子输出的内容只能说中规中矩,内容是完备的,但有点过于简洁了,在大众反馈上有一些信息缺失。

另外纯文字看着有点难受,不过额外发出指令就能够重新生成补充图表。

img

通义千问直接告诉我没有办法检索微信公众号的内容,然后根据官方消息和媒体报道生成了一个热点总结。

img

img但从输出的内容来看,通义千问相对扣子来说逻辑要更清晰一点,总结的点也更到位。

img

不过通义不支持图表输出,看着有点抽象。

img

到了Kimi就更抽象了,kimi大概只用了2s时间就检索完了所有信息,并给到了一个PDF下载链接。

img但遗憾的是这个链接点进去是空的,啥也没有。

img

而我们只得到了一个很简略的摘要,简短到让我抠脑壳。

imgEmmmm……只能说进步空间还很大吧。

对了,我还尝试了Kimi的学术搜索智能体,但最开始因为无法检索公众号,所以任务直接中断,第二次我没有要求平台了,但检索结果也不理想,甚至很多信源是前几年的。

img

img

img总的来说,内容检索和总结上,扣子在多形态信息输出上更有优势,但个人感觉如果只需要简短的文字总结,通义千问的检索和总结能力更厉害

Kimi的话……未来可期,嗯。

img

写文章

最后,艾哥把爪子伸向了我的老本行,写文章。

自从AI搜索普及之后,艾哥在写作过程中通常都少不了AI帮忙检索信息,但至今还没找到一个能直接帮我写文章的。

于是艾哥又提出一个要求:我的公众号面向手机汽车泛科技圈新闻等受众,我的文章内容要求:文章生动有趣,深入浅出,有自己的观点,内容来源有事实依据,生成一篇公众号文章。

img这个要求定位主打一个宽泛,像极了艾哥领导给艾哥布置任务时候的要求,需要Agent发挥极致的自主能动性。

还是先来看扣子,扣子依旧逻辑清晰的开始思考,在我圈定的手机汽车泛科技范围内进行热点检索。

img

不过扣子在理解最终需求的时候还是比较保守,选择了手机汽车生态交叉的地方为切入点。

思考过程这里就不详细放图了,浅放一下扣子生成的文章:

img

扣子确实给到了一个观点:手机和汽车的生态绑定逐渐加深。但不妨碍文章整体还是单纯的素材罗列。

img看来在写文章方面,目前的AI还是无法一步到位完成工作,需要更细致的调教,比如直接给出大纲。

坏消息:工作外包失败。

好消息:还没被AI替代。(bushi)

img

img因为我没在通义千问找到官方的写作智能体(非官方的很难用可以忽略),所以这趴通义缺席。

直接来看kimi。

Kimi依旧缺少思考过程,在检索了7个网站后,就给出了一个手机和汽车的“黑科技”的文章。

Kimi 2025-07-30.jpg

可能也是我给的范围太宽泛的原因,kimi的文章看着没有重点,分别写了手机拍照、折叠屏、智能驾驶、新能源环保等事情。

个人感觉文章是通过关键词检索后直接将内容组合而成,不管是时效性还是文章整体脉络都存在很大的问题。

img如果把这趴和上一趴结合来看,扣子通过更清晰的指令和多次修正,应该能够创作出不错的文章,但在创作力方面可能还有所欠缺。

按照艾哥的过往经验,豆包和deepseek在这方面应该更有优势。(感兴趣的可以测测)

img

好了,以上就是这次的测试内容,再次提醒:测试项目和内容是艾哥从自身需求出发随机出的,仅供参考。

扣子空间给我的惊喜比较大,它有一套完整的项目逻辑,是符合我认知里Agent的定义的,相对而言,kimi和通义千问距离Agent其实还有一点距离。

但说实话,这次的对比其实不是很明显,几个产品效果相差有点大了,搞得像在恰米。(真没恰)

img但其他比较好用的Agent要么只面向海外,要么需要付费,扣子相对而言是我们能接触到的门槛比较低的Agent。

其实我还是很期待国内能有更多好用的Agent产品出现的。

如何学习大模型 AI ?

我国在AI大模型领域面临人才短缺,数量与质量均落后于发达国家。2023年,人才缺口已超百万,凸显培养不足。随着Al技术飞速发展,预计到2025年,这一缺口将急剧扩大至400万,严重制约我国Al产业的创新步伐。加强人才培养,优化教育体系,国际合作并进,是破解困局、推动AI发展的关键。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

2025最新大模型学习路线

明确的学习路线至关重要。它能指引新人起点、规划学习顺序、明确核心知识点。大模型领域涉及的知识点非常广泛,没有明确的学习路线可能会导致新人感到迷茫,不知道应该专注于哪些内容。

对于从来没有接触过AI大模型的同学,我帮大家准备了从零基础到精通学习成长路线图以及学习规划。可以说是最科学最系统的学习路线。

在这里插入图片描述

针对以上大模型的学习路线我们也整理了对应的学习视频教程,和配套的学习资料。

大模型经典PDF书籍

新手必备的大模型学习PDF书单来了!全是硬核知识,帮你少走弯路!

在这里插入图片描述

配套大模型项目实战

所有视频教程所涉及的实战项目和项目源码等
在这里插入图片描述

博主介绍+AI项目案例集锦

MoPaaS专注于Al技术能力建设与应用场景开发,与智学优课联合孵化,培养适合未来发展需求的技术性人才和应用型领袖。

在这里插入图片描述

在这里插入图片描述

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

为什么要学习大模型?

2025人工智能大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。

在这里插入图片描述

适合人群

  • 在校学生:包括专科、本科、硕士和博士研究生。学生应具备扎实的编程基础和一定的数学基础,有志于深入AGI大模型行业,希望开展相关的研究和开发工作。
  • IT行业从业人员:包括在职或失业者,涵盖开发、测试、运维、产品经理等职务。拥有一定的IT从业经验,至少1年以上的编程工作经验,对大模型技术感兴趣或有业务需求,希望通过课程提升自身在IT领域的竞争力。
  • IT管理及技术研究领域人员:包括技术经理、技术负责人、CTO、架构师、研究员等角色。这些人员需要跟随技术发展趋势,主导技术创新,推动大模型技术在企业业务中的应用与改造。
  • 传统AI从业人员:包括算法工程师、机器视觉工程师、深度学习工程师等。这些AI技术人才原先从事机器视觉、自然语言处理、推荐系统等领域工作,现需要快速补充大模型技术能力,获得大模型训练微调的实操技能,以适应新的技术发展趋势。
    在这里插入图片描述

课程精彩瞬间

大模型核心原理与Prompt:掌握大语言模型的核心知识,了解行业应用与趋势;熟练Python编程,提升提示工程技能,为Al应用开发打下坚实基础。

在这里插入图片描述

RAG应用开发工程:掌握RAG应用开发全流程,理解前沿技术,提升商业化分析与优化能力,通过实战项目加深理解与应用。 在这里插入图片描述

Agent应用架构进阶实践:掌握大模型Agent技术的核心原理与实践应用,能够独立完成Agent系统的设计与开发,提升多智能体协同与复杂任务处理的能力,为AI产品的创新与优化提供有力支持。
在这里插入图片描述

模型微调与私有化大模型:掌握大模型微调与私有化部署技能,提升模型优化与部署能力,为大模型项目落地打下坚实基础。 在这里插入图片描述

顶尖师资,深耕AI大模型前沿技术

实战专家亲授,让你少走弯路
在这里插入图片描述

一对一学习规划,职业生涯指导

  • 真实商业项目实训
  • 大厂绿色直通车

人才库优秀学员参与真实商业项目实训

以商业交付标准作为学习标准,具备真实大模型项目实践操作经验可写入简历,支持项目背调

在这里插入图片描述
大厂绿色直通车,冲击行业高薪岗位
在这里插入图片描述

文中涉及到的完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐