1 引言

人工智能如今已成为我们日常生活的核心。大型语言模型(LLMs),如 ChatGPT、Gemini 和 Claude,在语言使用上表现出惊人的创造力、速度和近乎人类的水平。

但事实是:仅凭它们自身,不足以信任其进行关键决策。它们无法保证输出结果是基于现实的。

它们可能会违反规则,忽略因果关系,并做出短期看起来明智但长期来看却是灾难性的决策。

所以我问自己一个简单的问题:

“如果我们能构建一种新的思维来弥补这些缺陷,会怎么样?”

答案便是 奇美拉项目(Project Chimera)

  • 神经(LLM) → 创造性、直观的大脑
  • 符号 → 逻辑规则和安全保障
  • 因果 → 预测未来结果的预见性引擎

三种截然不同的智能形式,融合在一个智能体中。

1.1 奇美拉的实际表现

在短短60秒内,您将看到一个神经-符号-因果混合AI智能体如何做出战略性商业决策,适应市场变化,并在真实的模拟中超越竞争对手。

观看奇美拉项目演示 — 然后向下滚动以了解其内部工作原理。
在这里插入图片描述

1.2 LLM的短板

当前AI研究讨论中存在两大主要空白:

  1. LLM 并不真正理解规则。 如果你让它们设计一个销售活动,它们可能会建议一个会损害你利润率的价格 — 因为它们无法内化严格的业务约束
  2. LLM 无法理解因果关系。 它们可能会建议打20%的折扣,却没意识到这可能会在六个月后侵蚀你的品牌声誉。它们看到的是统计模式,而不是因果链

在现实世界中,这些空白转化为数十亿美元的风险

奇美拉的优势在于此

  • 凭借 符号守护者(Symbolic Guardian),它不能违反预定义的规则。
  • 凭借 因果引擎(Causal Engine),它能回答:“如果我做出这个决定,三个月后会发生什么?”

1.3 架构:三位一体的思维

“奇美拉”这个名字来源于由不同动物组成的神秘生物。我们的智能体是三种AI范式的混合体:

  • 神经(直观大脑) 其核心是一个强大的LLM(如 GPT-4o),它理解用户目标并生成创造性的策略和假设。这是智能体“头脑风暴”的地方
  • 符号(逻辑骨架) 一套严格的数学规则集,智能体绝不能违反 — 价格下限、利润率阈值、预算上限。它是防止危险或荒谬决策的安全网
  • 因果(预见之眼) 最具创新性的层。它使用 EconML 等因果推断库构建,从模拟数据中学习隐藏的因果关系。这赋予了智能体一种“预言”能力:“如果我采取这个行动,我的未来利润将如何变化?”

1.4 构建一个复杂的数字世界

为了测试这一点,我不仅构建了一个智能体,还为它构建了一个完整的生存世界。一个复杂的电子商务模拟器(EcommerceSimulatorV4),具有真实的经济原理:

  • 价格弹性
  • 广告回报递减
  • 品牌信任的脆弱性

我们将控制权交给了三种不同类型的智能体,让它们模拟经营公司一年。

2 测试

我们将奇美拉与两个更简单的竞争对手进行了较量:

  • 纯LLM:纯粹的直觉,没有规则,没有预见。
  • LLM + 符号:直觉加上规则,但没有因果预测。

在52周的时间里,每个智能体管理定价、广告预算和整体策略。

2.1 结果

现在,让我们分析一下结果:

  • 纯LLM:没有规则或预见,它陷入了混乱。在试图提升品牌信任时,它烧光了广告预算,导致了灾难性的数十亿美元损失
  • LLM + 符号:基于规则的守卫使其免于破产,但由于缺乏预见,它错过了盈利机会,并在年底亏损。
  • 奇美拉:唯一实现可持续盈利的智能体。它避免了摧毁其竞争对手的陷阱,因为它既了解规则,也了解其行动的长期后果。

这是我们测试的图表:

奇美拉与纯LLM和LLM+符号智能体的基准测试

结果表明奇美拉项目在初期取得了成功。

2.2 学习如何学习

随后,我们取得了突破:我们赋予了奇美拉从自身经验中学习的能力。

每10周,“学习智能体”都会根据所有累积数据重新训练其因果引擎,并与从未更新过的“静态智能体”进行竞争。

结果是?学习智能体获得的利润几乎是静态智能体的两倍 — 证明了持续适应的力量。

奇美拉与学习型奇美拉的基准测试

这表明了我们不断学习的智能体的策略是多么先进,以及它的成功是多么压倒性。

2.3 该项目的意义

如今,全球AI竞赛围绕着三个目标展开:

  1. 安全AI (安全性)
  2. 推理AI (符号逻辑)
  3. 因果AI (因果关系理解)

奇美拉项目是首批将这三者结合在一个架构中的工作原型之一。 尽管大多数研究论文仍停留在理论层面,但我们已经构建、运行并测试了它。

这不仅仅是一个演示 — 它是一个新AI标准的验证。

3 总结

我通过一个交互式应用程序和开源代码使其易于访问。

3.1 下一步计划

  • 可解释性:可视化因果图,以显示智能体做出每个决策的原因
  • 竞争模拟:多个奇美拉智能体在同一市场中竞争。
  • 通用框架:将应用范围从电子商务扩展到金融、医疗保健和物流。

LLM 向我们展示了智能的一个方面。 但要构建真正具有战略性、安全且着眼长远的AI,我们需要更多。

奇美拉项目证明了这是可能的 — 通过将神经、符号和因果智能统一到一个单一的、自适应的思维中。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐