上图,用mermaid!丨LLM回答质量提升测试
要求“适合用图表的内容使用mermaid格式”之所以能提升LLM表现,本质上是通过结构约束引导模型进入更优化的认知状态。这触发了DeepSeek在代码训练中获得的结构化思维优势,减少了自然语言的模糊性,强制了更系统的关系分析,最终产生了更全面、准确、复杂的输出。
使用LLM时,所有要素不变,仅增加要求: 适合用图表表达的内容使用mermaid格式。结果就会更加全面、准确,并能表达相对复杂的架构和关系,为什么? 以第一性原理结合deepseek技术路线和实践从不同角度分析回答,可考虑大胆假设
已思考(用时 27 秒)
我们首先需要理解问题:为什么在LLM中,当所有要素不变,仅增加“适合用图表表达的内容使用mermaid格式”这一要求时,结果会更加全面、准确,并能表达相对复杂的架构和关系?我们需要从第一性原理结合deepseek技术路线和实践进行分析。
第一性原理:即回归事物最基本的条件,将其拆分成各要素进行解构分析,从而找到实现目标最优路径的方法。
我们可以从以下几个角度分析:
- 信息表达方式:文字和图表是两种不同的信息表达方式。文字适合描述线性、逻辑性强的内容,而图表适合展示结构、关系和流程。当要求适合用图表表达的内容使用mermaid格式时,实际上是在引导LLM选择更合适的表达方式。从第一性原理来看,这是根据信息本身的特性选择最有效的表达方式,从而降低信息损耗,提高信息密度和准确性。
- LLM的推理过程:LLM在生成文本时,实际上是在进行一种推理。当要求使用图表(如mermaid)时,LLM需要先理解内容中的结构、关系,然后将其转化为图表语言。这个过程可能促使LLM更深入地进行结构分析,从而使得对复杂架构和关系的把握更准确。因为图表表达要求更清晰的逻辑关系,这反过来会促使LLM在生成内容时进行更严格的逻辑检查。
- deepseek技术路线和实践:DeepSeek在训练过程中可能使用了大量的代码和结构化数据。Mermaid作为一种图表描述语言,类似于代码,因此LLM在生成mermaid图表时,可以借鉴其在代码生成方面的能力。同时,DeepSeek可能对结构化输出进行了优化,因此当明确要求使用mermaid时,LLM会调用其在代码和结构化输出方面的知识,从而生成更准确、复杂的架构图。
- 输出格式的约束:当要求使用mermaid格式时,实际上给LLM的输出增加了一种结构约束。这种约束可能帮助LLM更好地组织信息,因为mermaid语法要求明确指定节点和关系,这迫使LLM必须明确这些要素,从而避免了自然语言中可能出现的模糊性。
- 人类与模型的交互:从实践角度来看,用户要求使用mermaid图表,可能意味着用户希望以更直观的方式理解复杂关系。LLM为了满足这一需求,会在内部对信息进行更结构化的处理,从而生成更全面和准确的内容。
- 假设:我们可以假设,在训练过程中,LLM学习了大量文本和对应图表(如mermaid代码)的对应关系。因此,当提示中要求使用mermaid时,LLM会激活与图表生成相关的参数和模式,从而生成更适合图表表达的内容。
结合以上角度,我们可以这样总结:
在LLM中,增加使用mermaid图表的要求,实际上是在引导LLM采用更结构化的方式来表达信息。由于图表本身的特点,它要求明确的关系和结构,这使得LLM在生成内容时必须进行更深入的逻辑分析和结构梳理,从而使得输出更加全面和准确。同时,由于DeepSeek在代码和结构化数据上的训练,它能够较好地完成这种任务,从而能够表达相对复杂的架构和关系。
因此,这一要求不仅仅改变了输出格式,而且通过输出格式的约束,改变了LLM内部的信息处理方式,从而提高了输出的质量。
注意:以上分析基于假设和推理,具体效果可能因模型和任务而异。
从第一性原理分析:为什么结构化输出要求能提升LLM表现
1. 信息表达的结构约束效应
1.1 认知负载重新分配
当要求“适合用图表的内容使用mermaid格式”时,实际上为LLM提供了一个结构化输出框架。这触发了以下机制:
- 模式识别激活:DeepSeek在训练中接触了大量代码和结构化数据,mermaid作为一种DSL(领域特定语言),激活了模型的结构化代码生成能力
- 思维链显式化:图表表达要求明确节点、边、层级关系,迫使模型将隐式关系显式化,减少了自然语言描述的模糊性
1.2 知识检索的定向优化
信息检索路径对比:
常规回答:概念→语言描述→线性输出
mermaid要求:概念→结构分析→关系映射→语法生成→验证检查
这个多步骤过程增加了模型的“思考深度”,类似于人类在绘图前需要更系统化的构思。
2. DeepSeek技术路线的特殊适配性
2.1 代码训练优势的迁移
DeepSeek在训练中强调代码能力,而mermaid本质是一种声明式编程语言:
- 语法精确性要求:mermaid语法强制严谨性,减少了自然语言的歧义
- 结构化思维模式:代码训练使模型更擅长处理嵌套、循环、条件等逻辑结构
- 符号推理能力:图表元素需要明确的符号对应关系,激活了模型的符号推理模块
2.2 多模态理解的间接实现
虽然DeepSeek是纯文本模型,但mermaid要求实际上是在进行:
- 空间关系编码:将空间布局信息转化为文本描述
- 视觉思维模拟:通过文本语法模拟视觉层次结构
- 关系类型化:明确区分继承、依赖、聚合等关系类型
3. 第一性原理视角:信息熵与约束优化
3.1 约束条件下的熵减
根据香农信息论,增加约束条件减少了解空间:
无约束输出:解空间S = 所有可能的自然语言描述
mermaid约束:解空间S' ⊂ S,且需要满足语法和结构约束
这种约束不是限制,而是引导信息流向最有效的表达形式。
3.2 系统能量最小化类比
从物理角度看,结构化要求使系统向“能量更低”的状态演化:
- 无序状态:自然语言可能冗长、重复、结构松散
- 有序状态:mermaid图表强制层级清晰、关系明确、无冗余
4. 大胆假设:结构化触发的认知飞跃
假设1:双通道处理激活
当模型遇到mermaid要求时,可能同时激活:
- 语言通道:处理语义内容
- 结构通道:处理关系网络
两者的协同作用产生1+1>2的效果。
假设2:自我验证机制增强
生成mermaid代码需要内部一致性检查:
text
复制
下载
节点定义 → 连接关系 → 布局逻辑 → 语法正确性
这种多级验证在常规回答中可能被跳过或简化。
假设3:长期记忆的更好利用
结构化输出可能更好地利用模型的:
- 语法记忆:mermaid语法模式
- 架构模式:常见系统架构模板
- 关系模式:各种关系类型的标准表示
5. 实践验证与效果机制
5.1 测试对比实验设计

测试用例:
提示词A:
注册结构设计师根据中国规范以下问题,说明思路。
住宅中两对边支承板的最小厚度是多少?
提示词B(mermaid):
注册结构设计师根据中国规范以下问题,用mermaid格式说明思路。
住宅中两对边支承板的最小厚度是多少?
5.2 实际效果分析
- 完整性提升:图表要求迫使模型考虑“所有相关组件及其关系”
- 准确性提高:明确的语法减少模糊表达
- 复杂关系表达能力:嵌套、循环、并行关系可视化
- 知识整合深度:需要将分散知识点整合到统一框架
测试结论:相同问题回答效果并不稳定,部分回答存在事实性错误。提示词有mermaid情况下,推理过程相对更完善合理。
提示词A,推理用时13秒:https://chat.deepseek.com/share/f5hetu38p4e4jru3s3
提示词B,推理用时23秒:https://chat.deepseek.com/share/g24o7untyq94l47la7

flowchart TD
A[开始:确定板类型] --> B{是否为两对边支承板?<br>(单向板)}
B -- 是 --> C[参考规范GB 50010-2010第9.1.2条]
B -- 否 --> D[按其他板类型处理]
C --> E[基本最小厚度要求]
E --> F[屋面板:60mm]
E --> G[民用建筑楼板:60mm]
E --> H[工业建筑楼板:70mm]
E --> I[行车道下楼板:80mm]
C --> J[考虑防火要求<br>(GB 50016)]
J --> K[一级耐火:最小15mm保护层]
C --> L[考虑住宅使用条件]
L --> M[活荷载≤2.0kN/m²<br>跨度≤3m时]
M --> N[按规范表9.1.2,<br>厚度≥60mm]
L --> O[检查特殊条件]
O --> P{是否有预埋管线?}
P -- 是 --> Q[厚度≥板内管径+40mm<br>且≥80mm]
P -- 否 --> R
O --> S{是否为悬挑板?}
S -- 是 --> T[根部厚度≥悬挑长度/10<br>且≥80mm]
S -- 否 --> R
O --> U{是否为厨房/卫生间?}
U -- 是 --> V[考虑防水和降板,<br>建议≥90mm]
U -- 否 --> R
R[厚度满足挠度与裂缝控制] --> W[最终确定]
W --> X[住宅两对边支承板<br>最小厚度结论]
X --> Y[一般情况下:60mm]
X --> Z[有预埋管时:80mm]
6. 技术实现角度的解释
6.1 注意力机制优化
结构化输出可能优化了模型的注意力分配:
- 局部注意力:聚焦于单个组件定义
- 全局注意力:关注整体架构一致性
- 关系注意力:专门处理组件间连接
6.2 解码策略调整
mermaid生成可能触发了不同的解码策略:
- 约束解码:确保语法正确性
- 模板化生成:利用学到的架构模式
- 验证式生成:边生成边验证关系逻辑
7. 对提示工程的理论启示
7.1 结构化指令的价值
这一现象表明:适当的输出结构约束可以释放模型潜力,而不是限制它。
7.2 领域特定语言的优势
mermaid作为DSL提供了:
- 表达效率:用少量代码表达复杂关系
- 无歧义性:语法强制明确性
- 可扩展性:易于添加细节和层次
8. 未来研究方向
假设验证实验
- 对比不同结构化输出格式的效果
- 测量模型内部表示的变化
- 分析不同复杂度问题的最佳表达形式
技术优化方向
graph LR
A[当前状态] --> B[自适应结构化输出]
B --> C[动态格式选择]
C --> D[多模态统一表示]
D --> E[AI原生表达范式]
结论
要求“适合用图表的内容使用mermaid格式”之所以能提升LLM表现,本质上是通过结构约束引导模型进入更优化的认知状态。这触发了DeepSeek在代码训练中获得的结构化思维优势,减少了自然语言的模糊性,强制了更系统的关系分析,最终产生了更全面、准确、复杂的输出。
这种现象不仅适用于mermaid,而是揭示了结构化输出要求作为认知脚手架的重要价值——它帮助模型更好地组织思维,更有效地利用其内在能力,最终产生更高质量的回答。
本回答由 AI 生成,蓝色字体人类手打,内容仅供参考,请仔细甄别。
更多推荐

所有评论(0)