AI大模型思维模式详解:从零基础入门到精通,一篇掌握COT/TOT/GOT/AOT四种高级思维!
文章介绍了大模型的四种高级思维模式:COT(链式思维)、TOT(树状思维)、GOT(图状思维)和AOT(算法模仿思维),旨在克服传统"刚性分类"的局限性。COT适合线性推理任务,TOT通过多路径探索和选择最优解,GOT构建有向图实现灵活合并与迭代,AOT则模仿特定算法进行系统性搜索。这些思维模式能提升大模型处理复杂问题的能力,适用于从创意写作到算法优化等多种场景。
文章介绍了大模型的四种高级思维模式:COT(链式思维)、TOT(树状思维)、GOT(图状思维)和AOT(算法模仿思维),旨在克服传统"刚性分类"的局限性。COT适合线性推理任务,TOT通过多路径探索和选择最优解,GOT构建有向图实现灵活合并与迭代,AOT则模仿特定算法进行系统性搜索。这些思维模式能提升大模型处理复杂问题的能力,适用于从创意写作到算法优化等多种场景。
大模型的几种思维模式
一、 COT、TOT和GOT思维
0. 刚性分类
现在好多提示词不好的原因主要是刚性分类,那什么是刚性分类:
给了LLM一堆严格的定义,并要求它“仅选择一个”。这种方法在输入非常纯净、意图单一时效果尚可,但一旦用户的输入变得模糊、包含复合意图,或者严重依赖上下文,LLM就很容易“选错”。
而大模型更加适合这种思考和推理,所以有了以下的思维方式。
1. COT(Chain of Thought)思维
思维链(CoT)是一种用于设计 prompt 的方法,即 prompt 中除了有任务的输入和输出外,还包含推理的中间步骤(中间思维)。他是一种链式的思维方式,即 按照一定的逻辑顺序,逐步深入地表达观点或解决问题。

主要用于有依赖任务的,例如需要LLM先完成第一步,然后根据第一步的结果处理第二步。这个时候同时也需要将第一步的结果输出。否则大模型可能会偷懒。
应用方式:在项目中的应用,比如在撰写项目报告、策划方案或进行技术讲解时,可以采用 COT 思维。首先明确核心问题,然后按照逻辑顺序,分步骤地阐述问题的背景、分析过程、解决方案以及预期效果。例如,在撰写市场调研报告时,先介绍市场现状,再分析消费者需求,接着提出产品定位策略,最后预测市场反应。
2. TOT(Tree of Thoughts)思维
TOT:**一种用树结构解决复杂问题的方法,**CoT通常只有一条解决问题的路径,ToT等于是CoT的一个拓展,把一条reasoning路径拓展至多条reasong paths,这样模型可以综合多条reasoning path的结果得到最终的结论。

ToT的一个具体实例化涉及回答四个问题:1.如何将中间过程分解为思维步骤;2.如何从每种状态中产生潜在的thought;3.如何启发式地评估状态;4.使用什么搜索算法。所以ToT就被分为了Thought Decomposition,Thought Generator,State Evaluator,Search algorithms四部分,第一部分是Thought Decompution,这个根据具体问题而定。
第二部分是Thought Generator,给定一个树的状态,我们要从k个候选项中决定下一个step,一般采用采样和投票的方法。State evaluator,给定不同状态的边界,状态评估器评估他们在解决问题方面取得的进展,并作为搜索算法的启发式算法,以确定要继续探索哪些状态以及以何种顺序进行探索,state evaluator有两种,可以是value类型的分类或者打分,另一种就是投票的形式。Search algorithm:ToT框架可以拔插式的使用不同的搜索算法。
举例:Create Writing是给你给定四个句子,然后产生4个paragraph,分别以这4个句子结尾,这样的任务是开放式和探索性的,挑战创造性思维和高层规划,ToT的做法是首先产生k=5个候选的plan,投票选择最佳的passage,基于最佳的plan,产生5个passage,然后选择其中产生的最佳passage,投票的过程是一个zero-shot的过程,例如(analyze choices below, then conclude which is most promising for the instruction)

3. GOT(Graph of Thoughts)思维

Graph of Thoughts(GoT)和其他prompting的策略的比较如上图,可以看到GoT直接构建了一个有向图来解决问题。了解了GoT的核心思想,我们来看一下怎么实现一个GoT的系统,GoT系统结构包含一系列的交互模块,如下图所示,这些模块包括Prompter(为LLM准备消息)、Parser(从LLM的回复中提取信息)、Scoring module(验证LLM回复并对其进行评分)和Controller(协调整个推理过程,并决定如何进行推理)。控制器包含另外两个重要元素:Graph of Operations(GoO)和Graph Reasoning State(GRS)。GoO是一种静态结构,它指定了给定任务的图分解,它规定了应用于LLM思想的转换,以及它们的顺序和依赖关系。GRS是一个动态结构,它保持正在进行的LLM推理过程的状态(其思想及其状态的历史)。图中蓝色部分包含架构概述,绿色部分列出API,示例图如下:

下图红色部分包含示例提示以及GRS和相关操作,具体是归并排序(先把list array,分解成sub array,sort后进行合并)任务的prompt的示例:

4. AOT【Algorithm of Thoughts】思维

AOT:一种用DFS/BFS示例解决问题的方法

上图显示的是LLM解决推理问题的几种方法,绿框表示LLM认为有前景的想法,而红框表示不太有前景的概念。可以看到AoT和ToT的方法的区别是,ToT会对节点进行剪枝,然后推理过程是一个树的结构;AoT利用示例的方式模仿DFS或者BFS,能够激发LLM的能力(论文说在GPT4上有很好的效果,估计对LLM本身的能力要求比较高),得到更好的结果。
🧠 大模型高级思维模式(LLM Thinking Paradigms)
🎯 背景:告别刚性分类
| 概念 | 描述 | 弊端 |
|---|---|---|
| 刚性分类 | 给出LLM一堆严格的定义,并要求它“仅选择一个”作为输出。 | 1. 脆弱性强: 仅适用于输入纯净、意图单一的情况。 2. 推理不足: 面对模糊、复合意图或高度依赖上下文的输入时,LLM容易跳过推理过程而直接“选错”,导致结果不可靠。 |
| 新思维模式 | 通过引入推理、搜索和结构化的中间步骤,让LLM进行深度思考。 | 克服了刚性分类的缺陷,更符合大模型擅长推理的特性。 |
在复杂的推理任务中,传统的“刚性分类”要求模型严格遵循定义并“仅选择一个”,这极易在输入模糊或意图复合时导致错误。以下高级思维模式旨在通过结构化和多路径的推理,克服这一局限。
| 模式 | 核心结构 | 推理路径 | 搜索机制 |
|---|---|---|---|
| COT | 链式/线性(Chain) | 单条,顺序依赖 | 无(直接推理) |
| TOT | 树状(Tree) | 多条,分支与剪枝 | 评估与搜索(BFS/DFS/Beam Search) |
| GOT | 图状(Graph) | 并行、合并、迭代 | 系统级协调(GoO & GRS) |
| AOT | 算法模仿(Algorithm) | 多条,按范例算法(DFS/BFS) | 范例驱动(Few-shot) |
- COT (Chain of Thought) 思维:线性推理
核心思想
链式推理(线性、逐步深入):将复杂任务分解为一系列按逻辑顺序排列的中间步骤,确保每一步的输出都作为下一步的输入。
适用场景
- • 顺序任务: 需要先完成第一步,再根据结果处理第二步的任务。
- • 依赖计算: 多步数学题、复杂公式推导。
- • 逻辑阐述: 项目报告、技术方案的分步骤讲解。
🛠️ 结构与提示词示例
| 应用场景 | 任务描述 | 核心价值 | 提示词侧重 |
|---|---|---|---|
| 复杂代码审查 | 审查一段新的业务逻辑代码,确保其符合所有的业务规则和安全标准。 | 确保逻辑覆盖和步骤完整性 。LLM 必须先理解业务规则,再逐步检查代码是否满足每一条规则。 | “请先列出代码必须满足的 5 个安全检查点,然后逐一检查并报告结果。” |
| 多步骤差旅规划 | 根据预算和时间限制,规划从 A 地到 B 地的包含火车、飞机和出租车的全程路线。 | 解决有依赖关系的连续性问题 。下一步的交通选择(如出租车)依赖于上一步(如飞机降落时间)。 | “请根据以下预算和时间限制,分步(行程、住宿、预算)规划您的差旅,并输出每一步的决策。” |
| 财报数据分析 | 计算某公司特定季度的净利润和同比增幅。 | 避免计算错误和偷懒 。强制 LLM 报告中间计算结果(如营收、成本、毛利),确保最终结果准确。 | “请分步计算公司的营收、总成本、毛利润、净利润,并计算净利润的同比增幅。要求输出所有中间值。” |
- TOT (Tree of Thoughts) 思维:树状探索
核心思想
树状探索(多路径、选择最优):将单条推理路径拓展为多条推理分支,通过评估和搜索机制,在多个潜在的“想法”中选择最佳方案。
适用场景
- • 开放式任务: 创意写作、头脑风暴、战略规划。
- • 探索性问题: 需要多个方案对比、选择最佳路径的复杂决策。
🛠️ 结构与关键组件
ToT 通过以下四个步骤实现树状搜索:
| 组件 | 功能 |
|---|---|
| 思维分解 | 将任务分解为更小的思维步骤。 |
| 想法生成 | 从当前状态生成 个潜在的下一步“想法”作为子节点。 |
| 状态评估 | 使用启发式方法(如分类、打分、投票)评估每个状态(节点)的潜力。 |
| 搜索算法 | 使用 BFS、DFS 或 Beam Search 进行探索和剪枝。 |
💡 示例 Prompt
请采用 ToT 思维模式,为我们的新产品提出 3 个推广计划,并选出最佳。
- 生成想法: 提出 Plan A(内容营销)、Plan B(社媒病毒)、Plan C(线下体验)。
- 评估状态: 根据“用户覆盖度”和“预算可行性”对三个计划进行 评分。
- 深化选择: 选出总分最高的计划,并详细阐述其执行步骤。
| 应用场景 | 任务描述 | 核心价值 | 提示词侧重 |
|---|---|---|---|
| 市场进入策略 | 为一个新的高科技产品制定进入市场的策略(是价格竞争、高端定位还是蓝海策略)。 | 探索多种可能性并进行评估 。LLM 分别生成 3-5 个市场策略,然后根据市场数据和目标人群进行打分和比较。 | “请提出至少 4 个独特的市场进入策略。然后,请根据‘潜在收益’和‘执行难度’两维度对每个策略进行评分(1-10),并选择得分最高的方案进行详细展开。” |
| 产品功能设计 | 设计一个新软件模块的核心功能,要求同时考虑用户体验、开发成本和技术可行性。 | 权衡多重约束的最优解 。LLM 提出不同的功能组合方案,通过评估模型对各方案进行权衡。 | “请生成 3 个不同的功能设计草案。接下来,使用‘用户体验评分’和‘开发成本预算’对它们进行评估,最终投票选出最佳方案并解释原因。” |
| 创意写作 | 为一个新电影写出 3 个不同的结局,并选择一个最能引发观众共鸣的结局。 | 激发并筛选创造性思维 。LLM 分支生成多个结局,然后通过“情感冲击力”等标准评估选择。 | “请创作 3 个风格迥异的电影结局。随后,分析哪个结局在叙事和主题上最具优势,并选出作为最终版本。” |
- GOT (Graph of Thoughts) 思维:图状关联
核心思想
图状关联(非线性、灵活合并):构建一个有向图结构来解决问题,允许思想(节点)之间进行并行处理、灵活的合并、迭代和转换,是比 ToT 更灵活的结构。
适用场景
- • 高度结构化任务: 涉及并行计算、多源信息整合、迭代优化。
- • 复杂算法流程: 如归并排序、多线程任务协调。
🛠️ 结构与系统组件
GoT 不仅是提示词方法,更是一个系统架构,通过以下模块协调推理:
| 组件 | 功能 |
|---|---|
| GoO (Graph of Operations) | 静态结构 :指定图分解,规定 LLM 思想的转换顺序和依赖关系(如:B 和 C 必须并行,D 依赖于 B 和 C 的合并)。 |
| GRS (Graph Reasoning State) | 动态结构 :保持推理过程的状态、思想及其历史。 |
| Prompter/Parser | 准备 LLM 消息/从 LLM 回复中提取信息。 |
| Scoring Module | 验证和评分 LLM 的回复。 |
💡 示例 Prompt(系统指令)
将任务分解为 GoT 结构:数据清洗(B) 和 特征提取(C) 必须并行执行;只有当 B 和 C 同时完成后,才能进行 模型训练(D)。
| 应用场景 | 任务描述 | 核心价值 | 提示词侧重 |
|---|---|---|---|
| 项目任务调度 | 协调一个包含多个并行和依赖任务的复杂项目(如软件开发)。 | 结构化并行处理和合并 。LLM 必须理解某些任务可以并行(如前端开发和后端开发),而最终的集成(合并)必须等待它们全部完成。 | “请将 [项目名称] 的任务分解为 GoT 结构。任务 A 和 B 必须并行;任务 C 必须依赖于 A 和 B 的结果合并后才能开始。请输出 GoO 流程图。” |
| 多源信息摘要 | 综合处理来自 3 份不同新闻报道、1 份内部报告和 2 个社交媒体评论,形成一份统一的风险分析报告。 | 高效的交叉引用和信息整合 。LLM 同时处理多个信息流(并行),识别冲突或冗余,并在最终的风险分析中进行合并。 | “请同时分析以下 6 份文件。首先,并行提取每份文件的核心观点;然后,将观点合并并识别其中的冲突点;最后,基于所有信息撰写一份结构化风险报告。” |
| 推荐系统优化 | 迭代优化一个推荐算法,需要根据用户的实时反馈(评分)不断进行微调。 | 支持循环和迭代优化 。LLM 在图结构中可以设置一个“反馈回路”节点,不断接收评分并调整算法参数,直到评分达到预定阈值。 | “根据 GoT 机制,设置一个推荐结果生成节点和一个用户反馈评分节点。每次评分低于 80 分时,启动‘参数微调’操作,并循环回到生成节点,直到目标达成。” |
- AOT (Algorithm of Thoughts) 思维:算法模仿
核心思想
算法模仿(范例驱动搜索):通过提供明确的、完整的算法执行示例(如 DFS/BFS),引导 LLM 模仿这种特定的搜索和推理逻辑。
适用场景
- • 系统性搜索: 需要穷举或按特定规则移动的搜索/解谜任务。
- • 复杂逻辑谜题: 依赖特定算法路径才能找到答案的问题。
🛠️ 结构与提示词示例
| 元素 | 描述 |
|---|---|
| 结构 | 任务输入 范例算法步骤(DFS/BFS) LLM 模仿推理 最终输出 |
| Prompt 关键 | “请像一个使用‘深度优先搜索(DFS)’算法的思考者一样来解决这个问题。”、“请用这种 [算法逻辑] 的思维方式来解决以下谜题。” |
💡 示例 Prompt
请模仿 DFS 算法的逻辑来分析并解决以下谜题:
DFS 范例:
- 从起点 A 开始,选择最深的路径 A B。
- 在 B,继续选择最深的路径 B C,失败。
- 回溯到 B,选择 B 的下一个未探索路径 B D。
请使用这种“一直探索到尽头,失败则回溯”的思维方式来解决: [谜题内容]
| 应用场景 | 任务描述 | 核心价值 | 提示词侧重 |
|---|---|---|---|
| 复杂逻辑谜题求解 | 解决一个需要穷举或状态空间搜索的谜题(如狼、羊、菜过河问题,或复杂的数独变种)。 | 引导 LLM 遵循特定搜索规则 。通过 DFS/BFS 范例,确保 LLM 系统性地探索所有可能的状态,而不是跳跃式思考。 | “请使用模仿 DFS 算法的思维方式来解决以下谜题:先尝试最远的状态,失败则回溯。提供一个完整的 DFS 解决过程作为范例。” |
| 法律条文匹配 | 在复杂的法律体系中,从数千条法规中找到一条最匹配特定案例的条款,要求按法律层级(联邦法 州法 地方法)进行搜索。 | 模仿分层搜索算法 。LLM 模仿 BFS 或层次搜索,确保先在联邦法层面搜索,无果后才进入下一层级。 | “请模仿层次搜索算法(如 BFS)的逻辑,从联邦法开始搜索,如果未找到匹配项,再进入州法搜索。请展示搜索的层次和路径。” |
| 最短路径规划 | 在一个复杂的、非标准化的地图上,规划从起点到终点的最短路径,需要考虑多个中间检查点。 | 利用图搜索算法(如 A 或 Dijkstra)的逻辑 *。通过范例,引导 LLM 进行启发式搜索,选择最有前景的路径。 | “请模仿图搜索算法的原理,为以下复杂的路径规划提供解决方案。每一步都需要评估当前路径的‘累计成本’和‘未来潜力’,并选择最优路径。” |
如何学习AI大模型 ?
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。【保证100%免费】🆓
CSDN粉丝独家福利
这份完整版的 AI 大模型学习资料已经上传CSDN,朋友们如果需要可以扫描下方二维码&点击下方CSDN官方认证链接免费领取 【保证100%免费】
读者福利: 👉👉CSDN大礼包:《最新AI大模型学习资源包》免费分享 👈👈
对于0基础小白入门:
如果你是零基础小白,想快速入门大模型是可以考虑的。
一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。
👉1.大模型入门学习思维导图👈
要学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。
对于从来没有接触过AI大模型的同学,我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。(全套教程文末领取哈)
👉2.AGI大模型配套视频👈
很多朋友都不喜欢晦涩的文字,我也为大家准备了视频教程,每个章节都是当前板块的精华浓缩。

👉3.大模型实际应用报告合集👈
这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。(全套教程文末领取哈)

👉4.大模型实战项目&项目源码👈
光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战项目来学习。(全套教程文末领取哈)
👉5.大模型经典学习电子书👈
随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。(全套教程文末领取哈)
👉6.大模型面试题&答案👈
截至目前大模型已经超过200个,在大模型纵横的时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。为了让大家更容易上车大模型算法赛道,我总结了大模型常考的面试题。(全套教程文末领取哈)
为什么分享这些资料?
只要你是真心想学AI大模型,我这份资料就可以无偿分享给你学习,我国在这方面的相关人才比较紧缺,大模型行业确实也需要更多的有志之士加入进来,我也真心希望帮助大家学好这门技术,如果日后有什么学习上的问题,欢迎找我交流,有技术上面的问题,我是很愿意去帮助大家的!
这些资料真的有用吗?
这份资料由我和鲁为民博士共同整理,鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位,在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利,同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。
资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。


CSDN粉丝独家福利
这份完整版的 AI 大模型学习资料已经上传CSDN,朋友们如果需要可以扫描下方二维码&点击下方CSDN官方认证链接免费领取 【保证100%免费】
读者福利: 👉👉CSDN大礼包:《最新AI大模型学习资源包》免费分享 👈👈
更多推荐



所有评论(0)