当前大的模型技术体系下,AI 的幻觉是如何产生的?
第二,发现人脑未察觉的规律,跨领域、时间周期的去验证,比如通过历史史料串联发现某一颗彗星的周期。幻觉的本质是不被人认可,或许是不合理的,或许是合理而超出人类观察认知的。AI并非像人类写作那样"先构思全文再校验逻辑",而是采用逐词预测的方式生成文本。但是可以看到,当前大模型掌握了所有的知识,相当于超越了个人的知识面,然后去进行知识的拼接。AI 生成结果时,不会自己互相校验,而是不断延伸后拼接
文章目录
抛砖引玉
第一问
问:
李承乾和魏王是什么关系
答:
李承乾和魏王李泰是唐太宗李世民的儿子,两人是同父异母的兄弟,但也是皇位争夺的政敌。他们的关系复杂而充满矛盾,最终导致了悲剧性的结局。
1. 兄弟关系
李承乾是李世民与长孙皇后的长子,自幼被立为太子,是唐朝的储君。
魏王李泰(字惠褒)是李世民与长孙皇后的第四子,才华横溢,深得父亲宠爱,被封为魏王。
略
发现回答内容有冲突,第二问
问:
两人是同父异母的兄弟
李承乾是李世民与长孙皇后的长子
魏王李泰(字惠褒)是李世民与长孙皇后的第四子
你这不是自己和自己冲突了
答:
您说得对,我的表述确实存在矛盾,感谢您的指正!
正确的表述应该是:
李承乾和李泰都是唐太宗李世民与长孙皇后所生的儿子,是同父同母的亲兄弟,而非同父异母。
AI 的幻觉的根源
错误产生的根本原因
(1)非连贯性生成模式
AI并非像人类写作那样"先构思全文再校验逻辑",而是采用逐词预测的方式生成文本。就像"接龙游戏":
每写一个词都基于前文概率预测下一个词
不会自动回溯修改已生成的内容(除非用户要求)
(2)知识检索的碎片化
当涉及复杂历史关系时:
关于"李承乾是长孙皇后所生"的知识存储在一个数据节点
"李泰是第四子"存储在另一个节点
系统在生成时更关注局部语义连贯而非全局事实校验
(3)人类逻辑的缺失
AI缺乏真正的因果推理能力:
能识别"同父异母"和"同父同母"的区别
但不会自动建立"如果A和B生母相同→他们必须是同母兄弟"的逻辑链条
简单看幻觉
AI 生成结果时,不会自己互相校验,而是不断延伸后拼接,其实不上实际的逻辑脱离.
问题:关键字1+关键字2+关键字3
推理过程和结果:关键字1-最大概率关联
+
关键字2-最大概率关联
+
关键字3-最大概率关联
所以结果是最大概率的集合,如果不加以甄别,就会出现幻觉。
从幻觉看价值
但是可以看到,当前大模型掌握了所有的知识,相当于超越了个人的知识面,然后去进行知识的拼接。
第一,为人类提供更多“知识的排列组合”的思路,比如蛋白质的结构。
第二,发现人脑未察觉的规律,跨领域、时间周期的去验证,比如通过历史史料串联发现某一颗彗星的周期。幻觉的本质是不被人认可,或许是不合理的,或许是合理而超出人类观察认知的。
第三,具备物理世界的感知和操控能力,此时AI 可以自己提出新思路,自己去验证。
用哈雷彗星的周期举例子(虽然哈雷彗星不是AI发现的)
1986年哈雷彗星回归时,航天器近距离观测确认:
轨道周期:75.3年(受行星摄动影响)
下次回归:2061年7月
通过整合历史史料来推算哈雷彗星的周期,确实是天文学史上的经典案例。以下是基于中外古籍记录的推演过程:
人类各文化传说和文明起源
更多推荐
所有评论(0)