当前大的模型技术体系下，AI 的幻觉是如何产生的？

第二，发现人脑未察觉的规律，跨领域、时间周期的去验证，比如通过历史史料串联发现某一颗彗星的周期。幻觉的本质是不被人认可，或许是不合理的，或许是合理而超出人类观察认知的。AI并非像人类写作那样"先构思全文再校验逻辑"，而是采用逐词预测的方式生成文本。但是可以看到，当前大模型掌握了所有的知识，相当于超越了个人的知识面，然后去进行知识的拼接。AI 生成结果时，不会自己互相校验，而是不断延伸后拼接

bestcxx

321人浏览 · 2025-08-11 12:50:11

bestcxx · 2025-08-11 12:50:11 发布

文章目录

抛砖引玉

第一问

问：

李承乾和魏王是什么关系

答：

李承乾和魏王李泰是唐太宗李世民的儿子，两人是同父异母的兄弟，但也是皇位争夺的政敌。他们的关系复杂而充满矛盾，最终导致了悲剧性的结局。

1. 兄弟关系
李承乾是李世民与长孙皇后的长子，自幼被立为太子，是唐朝的储君。
魏王李泰（字惠褒）是李世民与长孙皇后的第四子，才华横溢，深得父亲宠爱，被封为魏王。
略

发现回答内容有冲突，第二问

问：

两人是同父异母的兄弟
李承乾是李世民与长孙皇后的长子
魏王李泰（字惠褒）是李世民与长孙皇后的第四子
你这不是自己和自己冲突了

答：

您说得对，我的表述确实存在矛盾，感谢您的指正！

正确的表述应该是：

李承乾和李泰都是唐太宗李世民与长孙皇后所生的儿子，是同父同母的亲兄弟，而非同父异母。

AI 的幻觉的根源

错误产生的根本原因

（1）非连贯性生成模式

AI并非像人类写作那样"先构思全文再校验逻辑"，而是采用逐词预测的方式生成文本。就像"接龙游戏"：

每写一个词都基于前文概率预测下一个词
不会自动回溯修改已生成的内容（除非用户要求）

（2）知识检索的碎片化

当涉及复杂历史关系时：

关于"李承乾是长孙皇后所生"的知识存储在一个数据节点
"李泰是第四子"存储在另一个节点
系统在生成时更关注局部语义连贯而非全局事实校验

（3）人类逻辑的缺失

AI缺乏真正的因果推理能力：

能识别"同父异母"和"同父同母"的区别
但不会自动建立"如果A和B生母相同→他们必须是同母兄弟"的逻辑链条

简单看幻觉

AI 生成结果时，不会自己互相校验，而是不断延伸后拼接，其实不上实际的逻辑脱离.
问题：关键字1+关键字2+关键字3
推理过程和结果：关键字1-最大概率关联
+
关键字2-最大概率关联
+
关键字3-最大概率关联

所以结果是最大概率的集合，如果不加以甄别，就会出现幻觉。

从幻觉看价值

但是可以看到，当前大模型掌握了所有的知识，相当于超越了个人的知识面，然后去进行知识的拼接。
第一，为人类提供更多“知识的排列组合”的思路，比如蛋白质的结构。
第二，发现人脑未察觉的规律，跨领域、时间周期的去验证，比如通过历史史料串联发现某一颗彗星的周期。幻觉的本质是不被人认可，或许是不合理的，或许是合理而超出人类观察认知的。
第三，具备物理世界的感知和操控能力，此时AI 可以自己提出新思路，自己去验证。

用哈雷彗星的周期举例子(虽然哈雷彗星不是AI发现的)

1986年哈雷彗星回归时，航天器近距离观测确认：
轨道周期：75.3年（受行星摄动影响）
下次回归：2061年7月

通过整合历史史料来推算哈雷彗星的周期，确实是天文学史上的经典案例。以下是基于中外古籍记录的推演过程：
在这里插入图片描述

人类各文化传说和文明起源

在这里插入图片描述

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

agno v2.3.21版本发布详解：AgentOS全面支持Agent As Judge评测与多项稳定性增强

Agno v2.3.21版本是一次扎实的迭代，它没有引入颠覆性的变更，而是在现有强大的基础上进行打磨和增强。对于评估与监控：通过将Agent as Judge深度集成到AgentOS，它为团队提供了企业级的智能体性能评估工具，使得基于LLM的定性评估变得可配置、可触发、可追溯。对于框架稳定性：对RunInput序列化和MistralEmbedder超时的修复，解决了特定场景下的潜在bug，提升了框

2048 AI社区

21 Transformers - 训练语音模型

训练器为Transformers框架下的PyTorch预训练模型提供完整的训练和评估功能。其主要步骤包括计算损失、梯度更新权重、循环训练至指定epoch数。支持多GPU/TPU分布式训练和混合精度训练，通过TrainingArguments类实现高度定制化。

2048 AI社区

10分钟使用ModelEngine搭建心灵回声馆——从企业级AI工程化到轻量级情感对话应用实践

modelengine FIT：重新定义AI工程化的三维坐标系:传统AI项目开发往往面临技术栈割裂、流程冗长、部署复杂等挑战。ModelEngine提出的“FIT三维坐标系”——即FIT Core（多语言函数引擎）、WaterFlow（流式编排引擎）和FEL（Java生态的LangChain替代方案），正是针对这些痛点的系统性解决方案。FIT Core实现了“语言无界，算力随需”。它支持Java、