这两天,关注科技圈的朋友可能注意到了,一家中国AI企业Manus被扎克伯格的Mate以数十亿美元的高价收购,而这家中国AI企业在今年3月份才创立,创始人是从江西一普通小县城里走出来的,93年出生的青年肖弘。

真的是让人不禁感慨啊,江山代有才人出,一代新人换旧人,现在90后已经开始走向世界的舞台。同时,对当下AI发展的速度,也不由得让人一震。

这家中国AI企业Manus做的是AI Agent(智能体)的工作,让我对所谓AI Agent(智能体)产生了兴趣,于是查了一些资料,给自己也给大家做个通俗易懂的科普。

现在大部分人包括我在内,对AI的认知,大多还停留在ChatGPT或者Deepseek等国产的各种大模型上。你问它一个问题,它回你一段话;你让它写个总结,它吐出一篇文档。

这种模式,本质上是“对话式AI”。它更像是一个博学但瘫痪在床的老师。你问他,他知道;你让他去帮你下楼买个包子,他办不到。他没有手脚,没有行动力,他只能提供信息。

而所谓的AI Agent(智能体),就是给这位老师安上了手脚,并给了他出门办事的权利。

举个最简单的例子。

比如你想去大理旅游。

现在的AI聊天机器人模式是:你问它大理旅游攻略,它给你列出苍山、洱海、喜洲古镇等旅游景点,但你得自己去携程订机票,去美团订酒店,去小红书翻餐厅。

而Agent模式是:你对它说,“我想下周去大理玩三天,预算5000,要住能看到海的民宿,往返机票要下午出发的,帮我订好。”

说完这句话,你就不用管了。Agent会自己打开浏览器,去比价机票,去筛选评分高的民宿,去核对你的日程表看有没有冲突,最后直接把订单确认单发到你邮箱。

这就是本质区别:对话式AI提供“答案”,而AI Agent提供“结果”。

它不再是一个只会接话茬的聊天工具,而是一个具备自主意识、能够拆解任务、并调用外部工具去执行任务的“数字员工”。

了解编程的朋友可能会说,这不就是高级一点的自动化脚本吗?

其实不是。传统的自动化脚本是“死”的。比如你设定一个程序:如果A发生,就执行B。这叫逻辑预设。一旦现实情况稍微变了一点(比如机票卖完了),脚本就卡死了。

但Agent的逻辑更接近人类。它有四个核心支柱:感知、规划、记忆、行动。

规划(Planning):这是Agent最强的地方。当你给它一个复杂目标时,它会自发地把大目标拆成小步骤。比如要买机票,它知道先查日期,再查价格,再验证身份信息。如果中间遇到阻碍,它会自己想办法绕过去。

记忆(Memory):

现在的AI聊天,你关掉对话框,它可能就不记得你是谁了。但Agent有长期记忆。它记得你喜欢靠窗的座位,记得你对花生过敏,记得你上次出差住的是哪家酒店。它会根据这些历史数据,优化它当下的决策。

工具调用(Action):

这是它区别于单纯大模型的关键。大模型被关在“黑屋子”里,但Agent手里有一串钥匙。它可以调用搜索引擎,可以操作你的Excel,可以登录你的银行账户(如果你授权的话),甚至可以去代码环境里写一段代码并运行它。

感知(Perception):

它能观察环境。如果它发现某个网站改版了,原来的按钮找不到了,它会像人一样通过视觉识别重新找到那个按钮,而不是报错。

这就是为什么Manus能值这么多钱。而且据传Manus在处理复杂任务时的自主性,远超目前的同类产品。它不是在“模拟”对话,它是在“模拟”一个人的办公过程。

AI Agent的概念其实几十年前就有,但为什么直到今年才爆发?

因为以前的AI“大脑”不够聪明。

以前的AI,你让它去办件事,它分不清轻重缓急,理解不了模糊指令。你让它买“便宜机票”,它可能给你买一张凌晨三点起飞、中转三次、耗时20小时的票,因为它理解不了人类语境下的“性价比”。

直到大语言模型(LLM)的成熟,AI终于拥有了逻辑推理能力。

大模型给Agent提供了一个强悍的“大脑”。这个大脑能读懂人类的自然语言,能理解复杂的逻辑关联。有了这个大脑,再给它配上现成的互联网接口(API),Agent就瞬间从科幻变成了现实。

肖弘和他的Manus,正是踩在了大模型从“单纯思考”向“实际行动”跨越的这个奇点上。

那么这种变革意味着什么?

我们很多人可能还没意识到,Agent的普及,会比ChatGPT的出现更具冲击力。

在互联网时代,我们的逻辑是“人找工具”。你想买东西,你要去学习怎么用淘宝;你想做报表,你要去学习怎么用Excel。

但在Agent时代,逻辑变成了“工具找任务”。

你不再需要学习各种复杂的软件操作。你只需要下达指令,Agent去对接那些软件。软件的UI(界面)对你来说不再重要,因为你根本不需要点开它。

这会产生几个深远的影响:

第一,平庸技能的价值归零。

如果你在公司的价值只是“把PPT的数据填进Excel”,或者“在各个网站之间搬运信息”,那么Agent会以比你快一万倍的速度、比你低一万倍的成本取代你。这种取代不是温水煮青蛙,而是降维打击。

第二,个体生产力的极度放大。

以前你想开一家公司,你需要财务、行政、美工、助理。未来,一个懂业务的人,带着五个定制化的Agent,就能撑起一家公司的运转。肖弘的团队人并不多,却能做出几十亿价值的产品,这就是证明。

第三,流量入口的彻底重构。

如果以后大家买东西都通过Agent,那么现在的搜索引擎、购物平台、点评网站,它们的广告位卖给谁?Agent是不看广告的,它只看客观数据和你的偏好。这对“旧时代”的科技霸主是一个极大的冲击。

那么回到开头提到的肖弘。

很多人在讨论他的家乡,讨论他的学历,讨论他的运气。其实这些都是细枝末节。

最核心的一点是:在AI这个赛道上,以往的路径依赖失效了。

在传统互联网时代,大厂有垄断优势,有用户数据,有烧不完的钱。年轻人想突围,难如登天。

但AI Agent是一个全新的物种。它不完全靠堆算力,它更看重对任务逻辑的理解,看重产品思维,看重如何把大模型这个“笨拙的天才”调教成“干活的熟练工”。

这种领域,小团队的灵活性反而成了优势。

一个93年的青年,在不到一年的时间里,靠着对技术趋势的敏锐直觉,直接跳过了漫长的企业成长期,完成了阶层和财富的跃迁。这说明这个赛道的规则还没定死,这依然是一个充满野性的、英雄不问出处的时代。

但我们也要冷静地看到,这种神话极难复制。Manus被收购,很大程度上是因为Meta需要这种底层的Agent架构来完善其AI版图。对于普通创业者来说,Agent的门槛正在迅速抬高。

最后我想说,AI的发展速度已经超出了大部分人的认知。我们刚学会怎么跟对话机器人聊天,它就已经进化到能直接帮你把活儿干了。

Agent(智能体)的本质,是人类意志的延伸。

以前,你的想法要变成现实,需要通过你的双手,或者通过雇佣别人的双手。现在,你可以通过数字化的智能体去实现。

世界正在变得越来越“薄”。人和结果之间的那层厚厚的、繁琐的操作过程,正在被Agent一点点消解掉。

对于我们普通人来说,最重要的可能不是去学编程,也不是去搞大模型。而是去思考:当繁琐的过程不再是门槛时,你还能创造什么价值?

当有一个全能的助手能帮你处理掉所有杂事时,你有没有那个“判断力”去告诉它该往哪个方向走?

这个时代,不再是奖励那些勤奋的搬运工,而开始奖励那些真正有洞察力、有决策能力、能定义问题的人。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐