上图，用mermaid！丨LLM回答质量提升测试

要求“适合用图表的内容使用mermaid格式”之所以能提升LLM表现，本质上是通过结构约束引导模型进入更优化的认知状态。这触发了DeepSeek在代码训练中获得的结构化思维优势，减少了自然语言的模糊性，强制了更系统的关系分析，最终产生了更全面、准确、复杂的输出。

刘蕾540

636人浏览 · 2026-01-21 16:25:23

刘蕾540 · 2026-01-21 16:25:23 发布

使用LLM时，所有要素不变，仅增加要求：适合用图表表达的内容使用mermaid格式。结果就会更加全面、准确，并能表达相对复杂的架构和关系，为什么？以第一性原理结合deepseek技术路线和实践从不同角度分析回答，可考虑大胆假设

已思考（用时 27 秒）

我们首先需要理解问题：为什么在LLM中，当所有要素不变，仅增加“适合用图表表达的内容使用mermaid格式”这一要求时，结果会更加全面、准确，并能表达相对复杂的架构和关系？我们需要从第一性原理结合deepseek技术路线和实践进行分析。

第一性原理：即回归事物最基本的条件，将其拆分成各要素进行解构分析，从而找到实现目标最优路径的方法。

我们可以从以下几个角度分析：

信息表达方式：文字和图表是两种不同的信息表达方式。文字适合描述线性、逻辑性强的内容，而图表适合展示结构、关系和流程。当要求适合用图表表达的内容使用mermaid格式时，实际上是在引导LLM选择更合适的表达方式。从第一性原理来看，这是根据信息本身的特性选择最有效的表达方式，从而降低信息损耗，提高信息密度和准确性。
LLM的推理过程：LLM在生成文本时，实际上是在进行一种推理。当要求使用图表（如mermaid）时，LLM需要先理解内容中的结构、关系，然后将其转化为图表语言。这个过程可能促使LLM更深入地进行结构分析，从而使得对复杂架构和关系的把握更准确。因为图表表达要求更清晰的逻辑关系，这反过来会促使LLM在生成内容时进行更严格的逻辑检查。
deepseek技术路线和实践：DeepSeek在训练过程中可能使用了大量的代码和结构化数据。Mermaid作为一种图表描述语言，类似于代码，因此LLM在生成mermaid图表时，可以借鉴其在代码生成方面的能力。同时，DeepSeek可能对结构化输出进行了优化，因此当明确要求使用mermaid时，LLM会调用其在代码和结构化输出方面的知识，从而生成更准确、复杂的架构图。
输出格式的约束：当要求使用mermaid格式时，实际上给LLM的输出增加了一种结构约束。这种约束可能帮助LLM更好地组织信息，因为mermaid语法要求明确指定节点和关系，这迫使LLM必须明确这些要素，从而避免了自然语言中可能出现的模糊性。
人类与模型的交互：从实践角度来看，用户要求使用mermaid图表，可能意味着用户希望以更直观的方式理解复杂关系。LLM为了满足这一需求，会在内部对信息进行更结构化的处理，从而生成更全面和准确的内容。
假设：我们可以假设，在训练过程中，LLM学习了大量文本和对应图表（如mermaid代码）的对应关系。因此，当提示中要求使用mermaid时，LLM会激活与图表生成相关的参数和模式，从而生成更适合图表表达的内容。

结合以上角度，我们可以这样总结：

在LLM中，增加使用mermaid图表的要求，实际上是在引导LLM采用更结构化的方式来表达信息。由于图表本身的特点，它要求明确的关系和结构，这使得LLM在生成内容时必须进行更深入的逻辑分析和结构梳理，从而使得输出更加全面和准确。同时，由于DeepSeek在代码和结构化数据上的训练，它能够较好地完成这种任务，从而能够表达相对复杂的架构和关系。

因此，这一要求不仅仅改变了输出格式，而且通过输出格式的约束，改变了LLM内部的信息处理方式，从而提高了输出的质量。

注意：以上分析基于假设和推理，具体效果可能因模型和任务而异。

从第一性原理分析：为什么结构化输出要求能提升LLM表现

1. 信息表达的结构约束效应

1.1 认知负载重新分配

当要求“适合用图表的内容使用mermaid格式”时，实际上为LLM提供了一个结构化输出框架。这触发了以下机制：

模式识别激活：DeepSeek在训练中接触了大量代码和结构化数据，mermaid作为一种DSL（领域特定语言），激活了模型的结构化代码生成能力
思维链显式化：图表表达要求明确节点、边、层级关系，迫使模型将隐式关系显式化，减少了自然语言描述的模糊性

1.2 知识检索的定向优化

信息检索路径对比：
常规回答：概念→语言描述→线性输出
mermaid要求：概念→结构分析→关系映射→语法生成→验证检查

这个多步骤过程增加了模型的“思考深度”，类似于人类在绘图前需要更系统化的构思。

2. DeepSeek技术路线的特殊适配性

2.1 代码训练优势的迁移

DeepSeek在训练中强调代码能力，而mermaid本质是一种声明式编程语言：

语法精确性要求：mermaid语法强制严谨性，减少了自然语言的歧义
结构化思维模式：代码训练使模型更擅长处理嵌套、循环、条件等逻辑结构
符号推理能力：图表元素需要明确的符号对应关系，激活了模型的符号推理模块

2.2 多模态理解的间接实现

虽然DeepSeek是纯文本模型，但mermaid要求实际上是在进行：

空间关系编码：将空间布局信息转化为文本描述
视觉思维模拟：通过文本语法模拟视觉层次结构
关系类型化：明确区分继承、依赖、聚合等关系类型

3. 第一性原理视角：信息熵与约束优化

3.1 约束条件下的熵减

根据香农信息论，增加约束条件减少了解空间：

无约束输出：解空间S = 所有可能的自然语言描述
mermaid约束：解空间S' ⊂ S，且需要满足语法和结构约束

这种约束不是限制，而是引导信息流向最有效的表达形式。

3.2 系统能量最小化类比

从物理角度看，结构化要求使系统向“能量更低”的状态演化：

无序状态：自然语言可能冗长、重复、结构松散
有序状态：mermaid图表强制层级清晰、关系明确、无冗余

4. 大胆假设：结构化触发的认知飞跃

假设1：双通道处理激活

当模型遇到mermaid要求时，可能同时激活：

语言通道：处理语义内容
结构通道：处理关系网络

两者的协同作用产生1+1>2的效果。

假设2：自我验证机制增强

生成mermaid代码需要内部一致性检查：

text

复制

下载

节点定义 → 连接关系 → 布局逻辑 → 语法正确性

这种多级验证在常规回答中可能被跳过或简化。

假设3：长期记忆的更好利用

结构化输出可能更好地利用模型的：

语法记忆：mermaid语法模式
架构模式：常见系统架构模板
关系模式：各种关系类型的标准表示

5. 实践验证与效果机制

5.1 测试对比实验设计

测试用例：

提示词A：

注册结构设计师根据中国规范以下问题，说明思路。

住宅中两对边支承板的最小厚度是多少？

提示词B（mermaid）：

注册结构设计师根据中国规范以下问题,用mermaid格式说明思路。

住宅中两对边支承板的最小厚度是多少？

5.2 实际效果分析

完整性提升：图表要求迫使模型考虑“所有相关组件及其关系”
准确性提高：明确的语法减少模糊表达
复杂关系表达能力：嵌套、循环、并行关系可视化
知识整合深度：需要将分散知识点整合到统一框架

测试结论：相同问题回答效果并不稳定，部分回答存在事实性错误。提示词有mermaid情况下，推理过程相对更完善合理。

提示词A，推理用时13秒：https://chat.deepseek.com/share/f5hetu38p4e4jru3s3

提示词B，推理用时23秒：https://chat.deepseek.com/share/g24o7untyq94l47la7

flowchart TD
A[开始：确定板类型] --> B{是否为两对边支承板？ （单向板）}
B -- 是 --> C[参考规范GB 50010-2010第9.1.2条]
B -- 否 --> D[按其他板类型处理]

C --> E[基本最小厚度要求]
E --> F[屋面板：60mm]
E --> G[民用建筑楼板：60mm]
E --> H[工业建筑楼板：70mm]
E --> I[行车道下楼板：80mm]

C --> J[考虑防火要求 （GB 50016）]
J --> K[一级耐火：最小15mm保护层]

C --> L[考虑住宅使用条件]
L --> M[活荷载≤2.0kN/m² 跨度≤3m时]
M --> N[按规范表9.1.2， 厚度≥60mm]

L --> O[检查特殊条件]
O --> P{是否有预埋管线？}
P -- 是 --> Q[厚度≥板内管径+40mm 且≥80mm]
P -- 否 --> R

O --> S{是否为悬挑板？}
S -- 是 --> T[根部厚度≥悬挑长度/10 且≥80mm]
S -- 否 --> R

O --> U{是否为厨房/卫生间？}
U -- 是 --> V[考虑防水和降板， 建议≥90mm]
U -- 否 --> R

R[厚度满足挠度与裂缝控制] --> W[最终确定]

W --> X[住宅两对边支承板 最小厚度结论]
X --> Y[一般情况下：60mm]
X --> Z[有预埋管时：80mm]

6. 技术实现角度的解释

6.1 注意力机制优化

结构化输出可能优化了模型的注意力分配：

局部注意力：聚焦于单个组件定义
全局注意力：关注整体架构一致性
关系注意力：专门处理组件间连接

6.2 解码策略调整

mermaid生成可能触发了不同的解码策略：

约束解码：确保语法正确性
模板化生成：利用学到的架构模式
验证式生成：边生成边验证关系逻辑

7. 对提示工程的理论启示

7.1 结构化指令的价值

这一现象表明：适当的输出结构约束可以释放模型潜力，而不是限制它。

7.2 领域特定语言的优势

mermaid作为DSL提供了：

表达效率：用少量代码表达复杂关系
无歧义性：语法强制明确性
可扩展性：易于添加细节和层次

8. 未来研究方向

假设验证实验

对比不同结构化输出格式的效果
测量模型内部表示的变化
分析不同复杂度问题的最佳表达形式

技术优化方向

graph LR

A[当前状态] --> B[自适应结构化输出]

B --> C[动态格式选择]

C --> D[多模态统一表示]

D --> E[AI原生表达范式]

结论

这种现象不仅适用于mermaid，而是揭示了结构化输出要求作为认知脚手架的重要价值——它帮助模型更好地组织思维，更有效地利用其内在能力，最终产生更高质量的回答。

本回答由 AI 生成，蓝色字体人类手打，内容仅供参考，请仔细甄别。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

苹果Siri独立App来了：打磨两年仍是Beta，但这是苹果入局大模型的真正起点

独立App形态：从弹窗助手到对话AI，Siri获得专属交互入口Beta标签：打磨两年仍未完工，但苹果选择"先上线再迭代"三大核心能力：用户画像+屏幕感知+App整合，这是ChatGPT做不到的接入Gemini：务实选择，用外部能力补足自研短板30亿设备预装：全球最大AI分发渠道，零门槛覆盖Siri还是Beta，但这艘船已经离港。苹果用了两年时间证明：在AI时代，完美不是目标，速度才是。全球30亿台

2048 AI社区

Workspace：文件系统、项目上下文和执行边界

Workspace 是 OpenClaw 的上下文根目录和默认执行位置。它承载 Agent 指令、用户信息、工具约定、记忆、skills 和 Canvas 文件，也为工具提供默认 cwd。但它不是硬安全边界。Workspace 负责让 Agent 知道“我在哪、该按什么规则做事”；sandbox 和 approvals 才负责限制“我能碰什么”。