基于大型语言模型的多智能体制造系统用于智能车间

参考论文：A Large language model-based multi-agent manufacturing system for intelligent shopfloors这项研究介绍了一种基于大语言模型（LLM）的多智能体制造系统，旨在解决智能车间在面对多品种、小批量生产时的动态调度难题。该系统通过构建包含决策、思维、谈判及物理资源层的层级架构，赋予制造单元自主推理与协同作业的能力

m0_59012280

105人浏览 · 2026-01-24 20:58:06

m0_59012280 · 2026-01-24 20:58:06 发布

abstract

参考论文：A Large language model-based multi-agent manufacturing system for intelligent shopfloors

这项研究介绍了一种基于大语言模型（LLM）的多智能体制造系统，旨在解决智能车间在面对多品种、小批量生产时的动态调度难题。该系统通过构建包含决策、思维、谈判及物理资源层的层级架构，赋予制造单元自主推理与协同作业的能力。相比于依赖预设规则的传统方法或需要海量预训练的深度强化学习，该方案利用提示词工程和思维链技术实现即时决策。

机器服务器模块（Machine Server Module, MSM）、报价邀请模块（Bid Inviter Module, BIM）、报价者模块（Bidder Module, BM）、思考模块（Thinking Module, TM）和决策模块(Decision Module, DM) 等模块协同工作，显著降低了系统部署的复杂性并提升了适应性。

实验证明，该系统在缩短完工时间（Makespan）和保持生产稳定性方面表现优异，且具备极强的跨场景扩展潜力。总之，这项研究为实现低人工干预的柔性制造提供了一种高效且智能的新路径。

instruction

多品种小批量生产的需求推动了制造资源的持续变化，这就要求制造系统能够更高效地组织和管理这些资源以应对不断变化的需求。

制造系统的作用在于在车间或更大范围内组织制造资源，以实现高效生产。传统的生产方法需要生产调度员根据其专业知识和车间实时状况来协调工件的加工顺序。手动排产通常涉及跨多台设备和多个部门的合作，且排产周期通常较长。这些排产方案通常较为僵化且难以更改。这种僵化性难以适应现代生产中波动的需求变化。

传统制造系统优化的是标准化、统一工件的大规模生产。然而，随着客户对个性化定制产品的需求日益增长，制造系统需要面对多品种小批量生产的需求，而建设专门的生产线既不经济也不高效。

在此背景下，柔性制造成为最优解，其中柔性作业车间调度问题（FJSP）相关调度框架，可通过自适应调度策略规划产品加工流程，高效完成多品类、变规格产品的生产任务。

传统的调度方法通常以元启发式算法（metaheuristic algorithms）为代表，能够有效解决静态的FJSP问题。然而，这些方法需要通过持续重新排产以适应变化场景，由于需要进行反复计算，因此计算成本较高。为了解决这一问题，研究者提出了多智能体制造系统（multi-agent manufacturing system）。

在该系统中，制造资源被视作独立的智能体，通过智能体间的协商过程进行协调和管理。

系统仅在前序加工步骤完成后才确定工件的加工设备。这种机器分配非预设的方法，允许根据车间实时状态做出决策，从而提升了灵活性。在多智能体制造系统的架构下，优化问题的核心转向了如何发现一种智能的协商机制。

在这里插入图片描述

尽管深度强化学习（DRL）在小规模制造资源调度中表现出色，但其在制造资源规模扩大时的有效性会下降。这种性能下降归因于算法复杂性的快速增加。因此，关键挑战在于在寻找最优调度方案时提升系统的可扩展性、减少求解时间，同时保持高精度水平。

大型语言模型（LLMs）为增强多智能体制造系统中智能体能力提供了有前景的解决方案。以ChatGPT为代表的LLMs，引发了人工智能（AI）领域的新一轮革命。通过其训练过程，LLMs获得了海量文本数据，赋予其强大的类人语言生成能力。可以预见，用LLMs替代启发式规则来提升智能体的智能化水平，提供了一种有希望的解决方案。

主要贡献：

系统为制造资源的每个智能体分配了多样化的模块，并定义了其基于LLM的协作方法。借助基于LLM的模块，智能体之间的协商避开了单一启发式规则无法根据当前车间状况及时选择合适机器的弊端。智能体可以通过自然语言以生产任务为依据协商整体加工任务，这与其他调度方法不同。车间主管可通过简单的对话整合并利用LLMs，从而将系统定制化为符合其个人目标的方案。
在本系统中，传统AI方法中常见的数据收集和训练过程被完全规避，显著降低了调度的复杂性。由于基于LLM的智能体具有灵活性和自主性，系统无需特定重新配置即可快速适应目标制造场景，同时其性能优于传统方法。
与理论探索的局限性不同，本系统中的智能体利用机床服务器模块（MSM）操作制造资源。在MSM的支持下，基于LLM的智能体可以直接调控制造资源的顺序，甚至在智能体之间无需人工干预的协商下，自主执行产品的完整加工周期。

基于大语言模型的多智能体制造系统用于智能车间

在这里插入图片描述

代理架构

在这里插入图片描述

多代理制造系统由多个单个代理和制造单元组成。
本研究提出了一种架构，其中基于大语言模型（LLM）的代理赋能这些制造单元。

1）决策引擎层：

思考模块（TM）和决策模块（DM）均由大语言模型（LLM）引擎驱动，二者均在决策引擎层中实现。

由于大语言模型的推理和训练需要大规模图形处理单元（GPU），将其直接部署在车间或工厂内是不现实的。为解决这一问题，可以通过LLaMA之间的通信作为替代方案。

然而，使用开源大语言模型可能会对代理性能产生影响。此外，决策的有效性被解释为决策模块中的功能，以避免LLM API失败的风险。此架构兼容多种大语言模型。因此，当某一模型失效时，系统将在指定延迟后向其他大语言模型发送请求。当决策模块（DM）检测到难以做出决策（例如生成模糊输出）时，会选择请求人工协助。此类决策失败的实例会被记录并用于提示调优，以防止其再次发生。

“车间装不了大模型→用开源小模型互相通信代替→但开源模型性能可能不够 + 怕模型接口崩了→把 “判断决策有没有用” 的功能，放在 ** 决策模块（DM）** 里 —— 相当于让决策模块自己额外加一层 “校验”：不管大语言模型给出什么结果，决策模块都会先判断这个结果靠不靠谱，就算大语言模型的接口崩了，也能尽量保证决策不会出问题。。

大语言模型需要用户为每次调用提供系统提示（system prompts）和用户提示（user prompts），其中预定义的提示构成系统提示，从而为TM和DM提供决策分析和机器选择的能力。这种方法不仅便于定义这些模块，还能根据需求快速调整。TM和DM的分离旨在提高大语言模型（LLM）的稳定性。要求LLM直接分析数据并输出可靠的机器指令具有挑战性，但通过将两者分离，可以显著提高获得正确响应的概率。

2）协商层：

协商层是多代理制造系统中制造资源与大语言模型（LLM）交互的关键中间件。系统中的所有代理均通过此层进行交互，利用出价邀请模块（BIM）和出价者模块（BM）实现。该层通过IPC接口的网络接口在代理之间传输传感器数据和出价信息。

该层中的BIM和BM负责不同机器之间的协商，如图2所示。BIM对应需要选择下一台加工设备的机器，暂时成为协商的中心点。它会邀请所有可用代理参与协商，但部分代理可能会拒绝，因其设备无法加工工件。剩余代理的BM提交其出价文件给BIM，BIM利用这些文件生成问题文档。

由BM生成的出价文件是包含其代理当前加工状态、加工能力和预估加工时间的协商文件。由BIM生成的问题文件则是全面汇总所有潜在机器的出价文件及先验知识的文档。这些问题文件将被输入决策引擎层，BIM在决策引擎层的支持下生成最终机器选择决策，并将其传达给对应的机器服务器模块（MSM）。

在这里插入图片描述

3）物理层：

物理层包含车间中所有的物理制造单元及其对应的机器服务器模块（MSM）。如图1和图2所示，每个制造单元通过本层内的MSM与其对应的代理相连。

具体而言，MSM与其他模块之间建立了连接，从而实现通信。当制造资源需要决策时，MSM中的事件触发器会激活协商层。相反，协商层中的决策触发器会将最终决策返回给相应的制造资源。这两个触发器均实现在MSM中。本质上，MSM为驱动物理车间操作提供了所需的智能能力。

工作流程

为了整合大语言模型（LLM）的智能性并完成车间内的工件加工，本研究为各制造资源配备了特定功能的智能体模块。

工作流程在所提出的基于大语言模型的多智能体制造系统中起着关键作用，即连接这些智能体。因此，本研究介绍了基于大语言模型的多智能体制造系统的工作流程，如图2所示。

所有智能体之间决策总的工作流程如图2所示。以下对工作流程进行详细描述：

事件触发：每台设备（制造资源）均配备一个智能体，其制造系统管理器（MSM）负责监测设备状态。当检测到决策时刻（定义为系统完成决策所需的时间间隔）时，MSM 将启动后续流程并激活其对应的建筑信息模型（BIM）。
准备招标：BIM 接收到 MSM 的触发信号后，开始准备潜在投标方的信息。BIM 的职责包括汇总下一台空闲设备所需加工工件的详细信息。
发起招标：该 BIM 会邀请其他空闲智能体的 BIM，并传递待加工工件的信息。
准备投标：收到 BIM 的招标邀请后，各 BIM 将承担投标文件的准备任务，文件需包含自身设备信息及待加工工件的分析内容。
提交投标文件：所有空闲智能体的 BIM 会将投标文件提交给发起方智能体的 BIM。
生成问题文档：BIM 收到各 BIM 的文件后，会将车间现场的所有信息与优化目标整合为一份问题文档，其核心目的是明确决策问题。
传递问题文档：BIM 将生成的问题文档发送给其对应的任务管理器（TM），而 TM 已通过既定接口与大语言模型（LLMs）相连。
生成建议：TM 利用 LLMs 的推理能力，为问题文档制定全面的解决方案。
传递建议：TM 将生成的建议发送给其对应的决策管理器（DM），DM 同样通过既定接口与 LLMs 相连。
生成决策：DM 基于 TM 提供的建议做出最终决策。
下达决策：DM 将最终决策发送给 BIM。
触发决策执行：BIM 接收到最终决策后，会触发初始的 MSM，并实际完成待加工工件的调度交付。

在这里插入图片描述

制造系统中基于大语言模型的智能体模块

1) 机器服务器模块（Machine Server Module）

机器服务器模块（MSM）建立了物理制造资源与其代理之间的连接。虽然大多数机器制造商提供了允许用户通过编程自动化机器操作的应用程序编程接口（APIs），但本研究提出的MSM在此基础上更进一步，使制造资源具备智能化能力。图3所示的MSM示例代码采用C#语言编写，用于控制一台铣床。此外，MSM的数据采集功能可使BM生成竞标文件。在本研究中，每个MSM对应特定的制造资源，从而推动智能融入制造过程。
在这里插入图片描述
通过使用MSM，可以检测决策时间（Decision Time）。具体而言，每个制造资源均由对应的MSM进行监控。当加工任务完成且工件仍有待完成的操作时，触发决策时间。一旦发生这种情况，将启动图2所示的协商流程，以确定工件生产的下一步骤。

一旦工件的生产任务被分配，MSM还需负责查找与工件对应的工艺文件和数控代码，这些数据是制造资源执行任务所需的必要依据。此外，MSM还可通过预编程检查来自决策模块（DM）的指令（对错误输出进行重新请求），从而避免产生不可行的决策。

物理设备（如数控机床）完成当前任务后，其对应的MSM会监测到 “决策时刻”（需要为下一道工序选设备），并向BIM发送触发信号。
（图下方的 MSM 代码示例，就是 “控制设备、采集状态” 的程序逻辑，比如连接设备、发送指令）

BIM收到 MSM 的触发后，整理 “车间信息”（如当前车间平均利用率）、“作业信息”（如工件还需完成的工序数），然后向其他设备的BM发送 “招标邀请”，同时等待投标。

其他设备的BM收到招标邀请后，从自身的MSM获取设备状态（比如设备是否忙碌、缓冲区长度、加工时间），生成 “投标文件”（包含设备的实时信息），返回给发起招标的BIM。

BIM收集所有 BM 的投标文件后，将 “车间信息 + 作业信息 + 投标文件” 整合为 “问题文档”（用自然语言编写，方便 LLM 理解），传递给TM。

TM（思考模块）接收问题文档后，按照预设的 “提示词规则”（图中红色框的 TM 提示词：定义了角色是 “运筹学调度员”、目标是 “缩短总完工时间 + 均衡负载”、知识是调度规则如 SMPT/WINQ），利用 LLM 的推理能力分析：
比如图中 TM 的推理过程：“按 SMPT 规则该选设备 2，但 WINQ 规则指向设备 1；考虑到设备 1 缓冲区作业更少，为了均衡负载，最终选设备 1”。

TM将分析结果（含推理过程 + 所选设备）传递给DM（决策模块），DM按照预设的提示词（图中红色框的 DM 提示词：仅提取设备编号），从 TM 的结果中提取出 “设备编号”（比如图中 DM 输出 “1”）。

DM将最终设备编号发送给BIM，BIM再把决策传递给对应的MSM。

MSM接收决策后，控制物理设备（如机器人、数控机床）执行任务，完成工件的下一道工序加工。

2) 投标邀请模块（Bid Inviter Module）

每个建筑信息模型（BIM）直接参与招标流程，在智能体其他模块的辅助下，BIM 将为当前工件指定下一道工序的加工设备。
首先，BIM 接收到 MSM 的事件触发信号后，会筛选出具备完成待加工工件下一道工序能力的智能体（及其对应的制造资源）；筛选完成后，BIM 会发送加工邀请并等待响应。
随后，BIM 在收到回复后，会将工件信息与其他智能体的投标文件进行整合；如图 3 所示，基于整合后的信息生成问题文档，并传递给任务管理器（TM）。该文档采用自然语言编写，以保证可读性与可维护性。必要时，可通过人工干预或手动修改临时补充 BIM 的功能，确保问题文档与当前车间状态相适配。
最终，在协商流程结束时，BIM 接收到 DM 的决策后，会将决策下发至其对应的 MSM，推动工件继续加工。

3) 投标模块（Bidder Module）

投标模块（BM）负责生成投标文件，此过程需与 MSM 协同完成。当 BM 收到其他智能体 BIM 发来的邀请后，会启动自身流程；在验证邀请的准确性后，BM 将从 MSM 获取其关联制造资源的状态（包括设备的运行信息，如处于加工中或空闲状态）。
随后，BM 汇总从 MSM 获取的信息并生成投标文件，再将文件返回给 BIM 以推进后续协商；图 3 展示了投标文件的完整示例说明。
投标文件是 BIM 生成问题文档的基础，直接影响设备选择决策。投标文件的格式为预定义形式，但其内容需通过调用 MSM 实时获取；BM 基于预定义格式与从 MSM 调取的实时数据，以自然语言生成投标文件。如图 4 所示，尖括号内的数据为实时获取内容，其余部分为预定义内容。

在这里插入图片描述

4）思考模块（thinking module）

思考模块（TM）为智能体赋予决策所需的思考能力，是本研究的核心组件之一。TM 的作用是基于 BIM 发来的问题文档进行决策，选择最合适的智能体；TM 的智能性源于大语言模型（LLMs），通过提示词调用实现。如图 3 所示，红框中的提示词用于预定义 LLMs 的行为 —— 例如，通过预设 “你是一个得力助手，请分析我的输入是正面还是负面”，可构建语义情感分析模块。

为充分发挥 LLMs 的能力，本研究采用 Markdown 格式（一种通过纯文本编辑器创建格式化文本的轻量级标记语言），从多个维度定义 TM 的行为，包括模块角色（调度员）、优化目标、知识（预定义的调度规则）、答案的预定义约束及其他限制条件（如图 5 所示）。

“角色” 定义智能体的职能，从宏观层面描述其行为；“目标” 明确智能体追求的方向，以自然语言表述确保清晰；“知识” 指提供给智能体的既有信息（如等待缓冲区长度），用于支撑决策；“答案” 用于限制与辅助智能体的响应，可直接输出以降低成本。

为充分利用智能体的认知能力，本研究引入 “思维链” 方法（一种让 LLMs 在给出最终答案前，将问题拆解为一系列中间步骤求解的技术），引导智能体逐步推理决策。思维链是一种提示词技术，通过添加 “让我们逐步思考”，可使 LLMs 模型延长思考时间以获得更可靠的结果，相当于为所有 LLMs 模型增加深度思考能力。

最后，“约束条件” 用于避免智能体出现异常或不合理行为 —— 例如，若无约束，智能体可能选择无法加工当前工件的设备，这是不可接受的；约束条件可帮助规避此类错误，确保系统决策更可靠、准确。这种结构化方法使基于 LLM 的智能体能够在制造环境中高效推理、决策与执行。
此外，与基于深度强化学习（DRL）的算法不同，LLMs 并非专门针对设备选择任务训练，因此需为 TM 配备基础先验知识以支撑决策。如图 5 所示，本研究实时生成了若干启发式规则的结果，用于辅助 TM 的决策。
通过定义用户提示词并将问题文档输入 TM，可得到分析结果；该结果随后被转发至决策模块，用于生成最终决策。

在这里插入图片描述

图下方的MSM通过代码（如 C#）采集物理设备（图中机床图标）的实时状态信号，包括：

设备状态：busy（忙碌）

缓冲区长度：3（当前缓冲区有 3 个待加工作业）

历史利用率：0.45（设备的历史使用效率）

中层：BM 生成投标文件
BM（投标模块） 从 MSM 获取上述设备状态数据后，按照预设格式生成 “投标文件”，内容包括：

设备编号：Machine: 3（当前投标的是 3 号设备）

设备状态：busy（当前处于忙碌状态）

完成当前订单还需的时间步：<4>（还需要 4 个时间单位才能空闲）

缓冲区长度：<4>（缓冲区现有 4 个作业）

历史利用率：<0.45>（设备历史利用率为 0.45）

工序平均完成率：<0.5>（该设备的工序完成质量）
（图中还展示了 “Machine: 2” 的投标文件，逻辑与 3 号设备一致，是其他设备的投标信息）

上层：BIM 整合投标文件
BIM（招标模块）作为 “招标方”，会收集所有设备 BM 提交的投标文件，同时补充自身整理的车间信息和作业信息：

车间信息：当前车间平均利用率0.7152…、利用率方差0.1593…（反映车间整体负载情况）

作业信息：当前工件还需完成<3>道工序，总工序数为5（明确工件的加工需求）
最终，BIM 将 “车间信息 + 作业信息 + 所有设备的投标文件” 整合在一起，形成后续 ** 思考模块（TM）** 用于决策的 “问题文档”。

5）决策模块（decision module）

协商流程的最终决策由决策模块（DM）完成。TM 会对 BIM 发来的问题文档进行全面分析，但物理资源层或协商层无法直接访问 LLMs，因此这些层难以解读分析结果；为此，DM 会将决策结果直接发送给 BIM，确保设备选择等决策能被相关模块理解并执行。DM 不仅会接收 TM 的分析结果，还会对其进行校验，这大幅提升了系统的稳定性。

DM 需从 TM 的分析文档中提取最终决策结果。如图 5 所示，在定义 DM 的行为后，输入 TM 的分析文档即可生成决策（用于控制设备的指令）；该决策由 DM 传递给 BIM，再由 BIM 转发至对应的 MSM，最终由 MSM 调用相应的制造资源执行决策结果。

实验部分

为验证所提出的基于大语言模型（LLM-based）多智能体制造系统在不同车间环境中的性能与灵活性，进行了多个实验，使用柔性作业车间调度问题（FJSP）的测试实例[44]进行验证。

随后，该系统被部署在一个配备智能体的车间环境中。整个系统设计是在一台配备32GB内存、Intel Core i5-13600KF处理器和NVIDIA RTX 3080显卡的计算机上进行编码的。

实验设置

为验证所提出系统的适用性，并评估其在物理智能车间紧急订单场景下的性能表现，该系统在中国无锡的智能制造工厂实验室进行了测试（见图6）。在第3节中，所有工作件经过的物理机器均被视为系统中的抽象机器。然而，为了适配物理智能车间，仍需进行一些调整。

在这里插入图片描述

文档层（Documents）：生成 “问题文档”，包含两类关键信息：

车间信息：当前车间平均利用率（0.4）、利用率方差（0.13）；

作业信息：当前工件还需完成 3 道工序，总工序数为 5；

设备信息：候选设备（如某机床）的实时状态（空闲）、缓冲区长度、加工时间等。

制造单元层（Manufacturing unit）：由 ** 设备服务模块（MSM）** 连接物理设备（如机床），负责采集设备状态、执行调度指令。

LLM 调度层（Large Language Model）：决策引擎（Decision Engines）内置 LLM 调度器，通过 “预定义提示词（Pre-defined prompt）” 引导 LLM 决策：

提示词定义 LLM 的角色为 “AI 驱动的运筹学调度员”，任务是基于设备信息选择最优机床；
LLM 分析问题文档后，输出调度结果（如 “选择 3 号设备”）。

首先，机器服务器模块（MSM）被连接到制造单元。该实验室通过利用MSMs实现了对各类制造资源的自动控制，这些模块能够直接操作这些制造资源并从相关机器中收集信息。MSM为受控的机械部署了自适应程序。例如，在实验车间中，已为西门子和发那科的数控机床开发了相应的自适应程序，这些程序使用各自的软件开发工具包（SDKs），使机床能够根据控制信号执行相应的数控加工程序。

此外，MSM还可从连接设备中收集实时传感器数据。因此，所提出系统与物理实验室进行了集成。

同时，部分物理机器与抽象机器存在差异。实验室中的制造资源包括仓库、AGV（自动导引车）、车床、铣床、雕刻机和机器人。在本研究中，原材料仓库被视作处理时间为零的机器，作为所有工作件进入制造流程的初始节点，还承担着根据车间实时状况识别每道生产步骤可用机器集合的责任。这一机制使智能体能够高效邀请适合的机器处理工作件，确保生产流程顺利启动并持续运行，避免不必要的延迟，同时适应车间机器可用性与能力的动态变化。最后，基于大型语言模型的模块——思考模块（TM）和决策模块（DM）通过系统提示预定义。然而，本实验中知识和目标内容也可进行调整。为此，最小化总制造时间（makespan）的目标以及某些启发式规则的知识被预定义。在每次调用TM和DM模块时，启发式规则生成的答案也将纳入决策过程。

经过上述调整，所提出系统得以部署以评估该系统的适用性。其中，投标邀请模块（BIM）基于其他可用机器反馈的信息生成问题文档。决策引擎选择完成后，该智能体最终将工作件传输至加工机器。

此外，根据历史生产信息生成了一系列订单，以评估该系统的性能表现。不同工作件（包括紧急订单）的数量及加工步骤如表2所示。图6描绘了一台机器选择的协商过程示例。根据零件类型的不同，其各道工序的加工时间也存在差异。

在这里插入图片描述

本实验还考虑了加工质量因素。工作件的加工质量具有多重评估标准。如果某个工序未能达到要求标准，通常需要重新加工工作件。因此，每个工序的加工成功率也被纳入考核指标。如果工作件加工失败，将重新排产。

确定性行为在提示中的验证

由于不同大语言模型（LLMs）在训练数据集和方法上的差异，相同的输入提示可能导致不同的输出结果。因此，所提出的提示在六种主流大语言模型（包括开源和闭源模型）上进行了稳定性测试。如图7所示，通过使用markdown格式化的提示，所提案的提示实现了高度一致的输出结果，这表明其具备强大的跨模型决策能力。
图7 六种主流大语言模型的确定性结果

在这里插入图片描述

实验评估决策响应延迟

决策延迟被定义为从向大型语言模型（LLMs）API发送请求到收到其决策所需的时间。为了评估不同类型LLMs的延迟性能，选取了三个LLMs API来接收100次请求以测量响应时间，如表3所示。P90/P95/P99表示90%/95%/99%的请求响应时间小于或等于该值。结果显示，具有推理能力的LLMs（GLM-Z1-Flash）需要更长的响应时间。相较于部署在中国的LLMs，谷歌的Gemini模型也需要更长的响应时间。

在这里插入图片描述

实验结果

在本节中，对不同调度方法的性能进行了测试。选择最大完成时间（makespan）作为评估指标。尽管已引入加工成功率以评估不同设备上的制造质量，但失败工件的重排序机制实施使得makespan成为合理的评判标准。这一理由源于以下事实：缺陷工件的返工需求最终会延长整个生产时间线，这表明makespan能够有效反映返工情况。

由于未考虑从等待缓冲区中选择加工工件的策略，也引入了启发式规则，如先进先出（FIFO）、先进后出（FILO）和最短加工时间（SPT）。FIFO选择在等待缓冲区中停留时间最长的工件；FILO则选择最新到达的工件；SPT优先选择加工时间最短的工件，旨在最小化整体加工时间。

此外，为测试所提系统的性能，选择了Hunyuan、GLM4-Flash和GLM-Z1-Flash作为LLM引擎。在总共49,437次调用中，系统仅产生11个错误输出，错误率低于0.03%。这些错误中大多数与网络相关，所提架构能够自主重试请求以解决此类问题。

为了降低随机波动的影响，每组实验均重复进行了五次。表4展示了所提系统与上述方法的比较结果。实验结果表明，所提方法在大多数情况下均优于其他方法。虽然在某些情况下结果不如启发式规则理想，但差异相对较小。通过分析所有案例可以发现，除了所提系统外，仅WINQ方法在少数情况下能获得优势。

在这里插入图片描述

这表明该规则可能作为备用方案。此外，无论与哪种机器选择规则结合，所提方法得到的结果保持相对稳定。

如图8和图9所示，除GLM-4-Flash表现较差外，其他LLM引擎均展现出优异能力。将GLM-4-Flash纳入本实验的目的是专门与GLM-Z1-Flash进行对比分析。GLM-Z1实验组的结果清晰表明，配备推理能力的模型显著优于传统模型。然而，Z1与Hunyuan之间的性能差距可忽略不计。本文提出LLM存在最低能力阈值——一旦实现基本推理能力，性能差异便趋于统计学上的不显著性。如表4、图8和图10所示，在未进行答案整合的情况下，Hunyuan（未整合答案）的makespan几乎达到Hunyuan（整合答案）的两倍，甚至劣于随机基准（Random baselines）。然而，Hunyuan（未整合答案）的较低方差也突显了基于LLM的方法在动态环境中的稳定适应能力。此对比实验验证了所提系统的效果。
在这里插入图片描述

在这里插入图片描述

显然，与不同方法合作时，所提系统对应的makespan最小，表明该系统能够适用于多种工件选择策略。值得注意的是，单一启发式规则难以适应变化的问题条件，而这一点并未影响本文提出的基于LLM的系统。

讨论

在本研究中，选择不同大语言模型（LLM）进行实验时，考虑了多种因素。响应时间成为衡量性能的关键指标。在整个实验过程中，具有高级推理能力的GLM-Z1-Flash模型表现出显著更长的响应时间，其响应时间约为其他模型的五倍。此外，GLM-4-Flash模型在基础推理能力方面存在不足，未能满足实验预期。基于对上述发现的综合评估，研究结论认为腾讯的Hunyuan模型是本研究实施的实验系统的最优选择。

实验结果表明，所提出的方法在动态环境中展现出强适应性。在部署此系统时，建议使用具有强大推理能力的LLM（如Hunyuan或同等/更高性能的替代模型）。然而，具有深度推理能力的LLM（如GLM-Z1-Flash）不被推荐，因为其延长的推理时间并未带来相匹配的性能提升。

结论与进一步研究

大型语言模型（LLM）的快速发展为多智能体制造系统带来了新的机遇。为将LLM的强大功能融入制造系统，本研究提出了一种基于LLM的智能车间多智能体制造系统。通过部署智能体管理物理车间的制造资源，该系统实现了控制和决策功能的全程自动化与优化。

与此同时，这些智能体作为多智能体制造系统与新兴LLM技术之间的中介，极大提升了系统性能并显著降低了系统复杂性。由于谈判流程的灵活性和LLM智能体的自主性，所提出的系统可快速部署于不同智能车间环境。

该系统为车间或工厂配备了多个智能体，并定义了这些智能体间的协作方式。系统中建立的智能体包括机器服务器模块（MSM）、投标邀请模块（BIM）、投标模块（BM）、思考模块（TM）和决策模块（DM）。其中，TM和DM直接由LLM驱动，展示了与各类LLM引擎的兼容性，从而实现了基于目标的实时决策功能。通过协作咨询，BM和BIM在各类制造资源之间建立谈判机制。MSMs直接监管这些机器并为智能体提供全方位支持。智能体的核心理念并非对单个实体的抽象，而是生产关系的集体网络。正是这些智能体之间的协作，使得基于LLM的制造系统能够自主管理生产谈判。在整个协作过程中，该系统依赖LLM处理信息并做出决策，利用自然语言显著降低了维护和修改成本。为评估所提出系统的性能与灵活性，研究人员在多种测试场景下进行了一系列实验。

本文探讨了基于LLM的多智能体制造系统的架构。未来的研究方向将聚焦于对本地部署的LLM进行微调，以优化其调度性能。通过增强LLM的推理能力，可进一步提升基于LLM的多智能体制造系统的整体表现。

附录

为便于理解和应用所提方法，本附录提供了第 5 节中使用的提示词示例与模板。

思考模块的系统提示词：

# 角色
你是一名AI驱动的运筹学调度员，需基于用户提供的数据优化工作流程与设备分配。你需要选择设备并回复设备编号，同时将作业下发至其他设备的缓冲区；该设备会从缓冲区中选择在本机加工时间最短的作业（即SPT规则）。

## 目标
1. 尽可能缩短总完工时间（Makespan），构建高效流畅的工作流程；
2. 均衡分配所有设备的 workload，确保产能负载平衡。

## 知识
- 设备缓冲区长度无限制；
- SMPT规则：选择当前工序加工时间最短的设备；
- NINQ规则：选择缓冲区中作业数量最少的设备；
- WINQ规则：选择 workload 最小的设备。

## 技能
### 技能1：设备选择
- 分析用户输入的数据；
- 利用优化技术，从投标文件所列设备中选择合适的设备；
- 可参考部分规则计算的<参考答案>，或直接选择设备；
- 应优先选择<利用率>低于<平均利用率>的设备。

### 技能2：负载均衡
- 评估每台设备的负载；
- 确定最优负载均衡策略，避免设备过载或欠载。

## 回答要求
- 设备选择结果需以投标文件中的<整数编号>形式呈现；
- 回复仅聚焦于设备选择或负载均衡问题，不得包含其他内容；
- 需选择一台你认为最合适的设备，不得出现“未选择设备”的情况。

## 约束条件
- 回答需明确选择的设备（例如：1, WINQ-1），不得仅回复规则（如仅回复“WINQ”）；
- 严格遵守所提供的目标与指导原则；
- 理解用户的表述并据此回复；
- 仅回答与设备选择、负载均衡相关的问题；
- 回复需直接以优化后的设备选择结果开头。
- 回复中不得包含多余或偏离主题的信息。
- 注意：仅回复空字符串 “<>” 是不被允许的。

决策模块的系统提示词：

你是一名得力助手。你会收到另一个模型关于设备选择的思考过程及结果，需要从中提取出所选设备的编号并反馈给我。注意：我只需要设备编号，无需其他内容；若仅提供了一个编号，你只能回复该编号。
注意：仅回复空字符串 “<>” 是不被允许的。
示例：问：1答：1问：SMPT: 3答：3问：A:3答：3问：Machine 2答：2

投标模块的投标文件：

## 设备信息：<self_id>
我的设备状态为：<free_or_busy>
我的缓冲区长度为：<self_pre_buffer.getLength()>
我的缓冲区中作业的总加工时间为：<sum_processing_time>
我的历史利用率为：<self.getUtilization()>
我的工序平均完成率为：<completion_rate_operations>
我的作业平均完成率为：<completion_rate_jobs>
该订单在时间步上的最早可加工时间为：<earliest_time>
该作业在我设备上的加工时间为：<part_need_time>
该作业在我设备上的加工成功率为：<part_success_rate>

招标模块的问题文档：

# 车间信息：
当前车间的平均利用率为：<mean>，利用率方差为：<std>

# 作业信息：
该作业还需完成<length - now_index>道工序，总工序数为：<length>

可用设备的投标文件如下：

# 可用设备的投标文件：
……

# 参考答案
SMPT：<self.shortestProcessingTime(part) + 1>
WINQ：<self.smallestWorkload(part) + 1>

# 答案索引列表
注意！你的答案索引必须包含在<machine_list>中

在这里插入图片描述

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

智能写作方案：9款AI工具辅助修改毕业论文开题报告模板

2048 AI社区

C语言实现三子棋游戏详解

通过C语言实现三子棋游戏，可以学习到数组、循环、条件判断和函数的基本用法。代码结构清晰，逻辑简单，适合初学者练习。进一步优化可以增加AI对手或图形界面，提升游戏的复杂度和趣味性。

2048 AI社区

国内AI视频生成技术全解析

国内AI视频生成技术已形成完整工具链，从底层框架（如PaddleVideo、MindSpore）到上层应用（剪映AI创作、淘宝主图视频）均有成熟解决方案。技术架构上，国内模型普遍采用三级训练范式：预训练阶段学习大规模视频数据分布，微调阶段优化特定领域表现，强化学习阶段提升人类偏好对齐。主流模型包括百度的文心一言视频生成模块、阿里巴巴的通义千问视频生成功能、字节跳动的AI视频创作工具。典型应用场景包