解锁大模型:小白也能懂的原理与缺陷,程序员必看收藏
文章深入解析了大模型的工作原理(连接主义,基于概率预测),介绍了其核心能力(上下文学习、智能涌现),并系统阐述了四大缺陷:幻觉、知识滞后、表现不稳定和P^n问题。针对这些缺陷,作者提出了相应的解决方案,如工具调用、搜索增强生成、提示词工程和多智能体协作。最后,作者提出"AI是可能性的艺术"的观点,强调在使用AI时需区分确定性与不确定性,采用务实灵活的方式与AI协作。
文章深入解析了大模型的工作原理(连接主义,基于概率预测),介绍了其核心能力(上下文学习、智能涌现),并系统阐述了四大缺陷:幻觉、知识滞后、表现不稳定和P^n问题。针对这些缺陷,作者提出了相应的解决方案,如工具调用、搜索增强生成、提示词工程和多智能体协作。最后,作者提出"AI是可能性的艺术"的观点,强调在使用AI时需区分确定性与不确定性,采用务实灵活的方式与AI协作。
导读
从ChatGPT这类大语言模型(文中简称大模型)出现到现在已经过去三年了,AI和大模型的概念已经成为大家日常工作生活绕不开的话题了,这是好消息,毕竟从概念到使用的普及是每个新技术必经的阶段。
但现实又魔幻的是,一方面大量媒体在说AI是无所不能的,人人都能通过写提示词(Prompt)做一个智能体,甚至你只要说几句话就能把软件编程工作做好(Vibe Coding)。另一方面很多报道又在说95%的AI项目实际上都失败了。
真相到底是什么?要知道真相需要来看看大模型的工作原理是什么?它的能力边界在哪里?如何应对?

大模型的本质
大模型是机器学习的一种,机器学习中有符号主义和连接主义,而大模型属于连接主义的一种。
最早的机器学习是符号主义的做法。符号主义的目标是要找确定的、可解释的解。常见手段就是找到符合要求的一个函数Y=f(x)。找出已知的x和Y的对应规则(比如线性、指数、正态分布等),就能计算新的x对应的Y值。拿医学诊断举例。x变量是人的症状(发烧、咳嗽)、指标(病原体、白细胞)、药物等,规则就是变量之间的对应关系(比如发烧+白细胞值+病原体值 = 细菌感染),结论Y就是推荐使用抗生素。
连接主义不依赖显式规则,通过数据训练让模型拟合统计规律,输出近似最优的预测结果。比如猫的图片识别,因为没法穷尽猫的特征规则,干脆让模型自己在统计过程中找出特征,效果好不好就看模型预测的总体表现。所以连接主义的本质是近似,是预测。
符号主义解决不了现实问题很复杂性问题,毕竟问题涉及到的特征变量无法穷尽,这也是为什么后来连接主义逐渐占了上风,大模型就是连接主义的典型代表。
也就是说大模型的回答仅仅是个近似答案,哪怕你问一个事实性的问题,大模型给出的回答也只是它认为最大概率的那个。举例说,当你问“中国的首都是哪个城市”,大模型会回答“北京”,但大模型本身其实没有存储类似“中国的首都是北京”这种知识。来看一下大模型回答这个问题的大致流程:
1、【拆】把输入的问题(确切讲是大模型收到的整段提示词)拆成单个汉字或词语(确切讲是token)。一种可能的拆解是:中国、的、首都、是、哪个、城市。
2、【关联】分析每组汉字的关联程度(注意力机制),发现“中国”和“首都”是强关联的,而模型通过训练数据学习到了“中国的首都”后面几乎都跟着“北京”,这种关联关系被模型以参数的形式“记”了下来。
3、【预测】基于前面的关联分析,模型从第一个字开始,逐个预测下一个概率最高,最符合关联关系的字,直到形成完整句子。所以它不是“一次性想出完整答案”,而是“逐字接龙”。
因此,大模型生成答案的过程不是在真的思考,而是基于海量数据学习得来的统计分布,算出下一个token的概率分布并选出最大概率的候选token,不断重复这个过程,直到结束。
大模型的能力
大模型利用概率统计的原理生成问题答案的能力也许并不稀奇,稀奇的是大模型的上下文学习能力和智能涌现。
上下文学习指你的问题里不用告诉大模型示例或者给出少量示例,大模型就能理解你的问题。举例说模型未训练过情感分类能力,却能判断出“这部电影很精彩”为积极情感。给出两三个示例中文到英文翻译,它就能完成同类翻译。
我们知道大模型的大主要指模型的参数量大(有时也泛指训练数据量大,模型层次多),随着模型参数规模的不断增大,模型的表示能力和学习能力也不断增强。当参数规模达到某个临界点时,模型能够捕捉到更复杂的模式和关系,从而出现智能涌现的现象,这在小规模参数的模型中是看不到的能力。
智能涌现包括多步骤的逻辑思维推理、复杂问题求解比如多约束条件下做出方案设计、超出基础信息整合的创造性能力比如剧本创作。
大模型的能力缺陷及应对
正因为上下文学习能力、智能涌现能力等让大家看到了AI成为超级智能的曙光。但大家也发现,大模型初用起来似乎很智能,但随着你用得越多就会发现大模型也在暴露更多的短板,特别是你自己擅长的领域里。
这些能力缺陷归根到底是因为大模型的本质是基于输入内容来计算概率并做出预测,这就意味着它没办法保证答案是100%正确的。理解这一点就容易接受理解大模型当前的缺陷以及找到对应的解决办法。拆解来说有这么几类:幻觉、知识不够新、表现时好时坏、Pⁿ问题。
幻觉
幻觉就是大模型有时候会一本正经地胡说八道。比如捏造不存在的事实、逻辑矛盾。解决办法就是把相关知识告诉大模型,通过实时联网查询或者查询企业自己的知识库。对应的技术手段就是利用大模型来调用工具(Function Call、MCP)和搜索增强生成(RAG)。
知识不够新
大模型训练的数据有截止日期的,这意味着大模型不知道在这个日期之后的知识,也就是回答不了相关的问题。解决办法就是实时联网查询信息,对应的技术手段就是调用工具(Function Call、MCP)。
表现时好时坏
根据前面内容,我们知道大模型生成答案的过程非常依赖输入给它的上下文信息,也就是提示词的完整内容。如果提示词的内容很糟糕,那大模型给的答案也不会好。比如表述模棱两可不精准,让大模型预测困难;上下文太长了干扰大模型看到有效信息从而牺牲大模型回答的质量;没有包含历史对话失去了大模型了解你的机会等等,总之,大模型的表现跟输入内容的质量呈正相关。
可能你会想,要不我通过输入面面俱到,大而全的内容给大模型,这样就不会遗漏信息了。很遗憾,大模型能承载的输入内容的大小有限制,也就是我们常说的上下文窗口的大小有限制。这意味着你需要仔细琢磨放什么内容在上下文窗口里,尽量短小而有效。而这就是早期提示词工程(Prompt Engineering),以及最近上下文工程(Context Engineering),也包括智能体(Agent)在解决的最核心一类问题。换句话说这个问题解决的怎么样,直接决定了AI使用的效果。
Pⁿ问题
除了以上问题,大模型还有P^n问题。即每一步的成功率是P,随着连续n个步骤后,最终的效果只有Pⁿ。举例说,单步的成功率是95%,持续经过5步后就是77.37%,这个效果下降会非常快。而现实中的复杂问题往往需要拆分出多个步骤,多个步骤可能都会涉及调用大模型,所以可想而知最后的解决效果。
这个问题的解决办法会有很多,最好的办法是分析任务性质,不滥用大模型。能用确定性的程序或工作流解决的就不要用大模型。需要用大模型的时候,尽量让每个任务聚焦职责,各司其职,做到最佳。这也是多智能体(Multi-Agent)发展的背景之一。
结语
现实当中我们要解决的问题中充斥着“符号主义”追求的确定和“连接主义”追求的近似。这就给我们使用AI解决现实问题提出了高的要求,一方面要全面认识AI的能力和缺陷,另一方面要分析现实问题的性质,以免错配了问题和能力。
借用德国政治家俾斯麦说过的一句很有名的话“政治是可能性的艺术”,彼时他说那句话的背景正是德国统一大业成败未卜的时刻,他利用务实又灵活的策略争取到了国内的民主人士、社会主义人士,最大程度汇集了各方力量。
此时的AI还不是万能的,甚至很多场合还不能让人放心。因此“AI是可能性的艺术”。我们使用AI也是在寻找一种可能性,在等待AI基础能力更强大之前,需要区分确定的和不确定的,用务实又不失灵活的方式与AI并肩前行。
随着大模型的持续火爆,各行各业纷纷开始探索和搭建属于自己的私有化大模型,这无疑将催生大量对大模型人才的需求,也带来了前所未有的就业机遇。**正如雷军所说:“站在风口,猪都能飞起来。”**如今,大模型正成为科技领域的核心风口,是一个极具潜力的发展机会。能否抓住这个风口,将决定你是否能在未来竞争中占据先机。
那么,我们该如何学习大模型呢?
人工智能技术的迅猛发展,大模型已经成为推动行业变革的核心力量。然而,面对复杂的模型结构、庞大的参数量以及多样的应用场景,许多学习者常常感到无从下手。作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。
为此,我们整理了一份全面的大模型学习路线,帮助大家快速梳理知识,形成自己的体系。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
一、大模型全套的学习路线
大型预训练模型(如GPT-3、BERT、XLNet等)已经成为当今科技领域的一大热点。这些模型凭借其强大的语言理解和生成能力,正在改变我们对人工智能的认识。为了跟上这一趋势,越来越多的人开始学习大模型,希望能在这一领域找到属于自己的机会。
L1级别:启航篇 | 极速破界AI新时代
- AI大模型的前世今生:了解AI大模型的发展历程。
- 如何让大模型2C能力分析:探讨大模型在消费者市场的应用。
- 行业案例综合分析:分析不同行业的实际应用案例。
- 大模型核心原理:深入理解大模型的核心技术和工作原理。

L2阶段:攻坚篇 | RAG开发实战工坊
- RAG架构标准全流程:掌握RAG架构的开发流程。
- RAG商业落地案例分析:研究RAG技术在商业领域的成功案例。
- RAG商业模式规划:制定RAG技术的商业化和市场策略。
- 多模式RAG实践:进行多种模式的RAG开发和测试。

L3阶段:跃迁篇 | Agent智能体架构设计
- Agent核心功能设计:设计和实现Agent的核心功能。
- 从单智能体到多智能体协作:探讨多个智能体之间的协同工作。
- 智能体交互任务拆解:分解和设计智能体的交互任务。
- 10+Agent实践:进行超过十个Agent的实际项目练习。

L4阶段:精进篇 | 模型微调与私有化部署
- 打造您的专属服务模型:定制和优化自己的服务模型。
- 模型本地微调与私有化:在本地环境中调整和私有化模型。
- 大规模工业级项目实践:参与大型工业项目的实践。
- 模型部署与评估:部署和评估模型的性能和效果。

专题集:特训篇
- 全新升级模块:学习最新的技术和模块更新。
- 前沿行业热点:关注和研究当前行业的热点问题。
- AIGC与MPC跨领域应用:探索AIGC和MPC在不同领域的应用。

掌握以上五个板块的内容,您将能够系统地掌握AI大模型的知识体系,市场上大多数岗位都是可以胜任的。然而,要想达到更高的水平,还需要在算法和实战方面进行深入研究和探索。
- AI大模型学习路线图
- 100套AI大模型商业化落地方案
- 100集大模型视频教程
- 200本大模型PDF书籍
- LLM面试题合集
- AI产品经理资源合集
以上的AI大模型学习路线,不知道为什么发出来就有点糊,高清版可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

二、640套AI大模型报告合集
这套包含640份报告的合集,全面覆盖了AI大模型的理论探索、技术落地与行业实践等多个维度。无论您是从事科研工作的学者、专注于技术开发的工程师,还是对AI大模型充满兴趣的爱好者,这套报告都将为您带来丰富的知识储备与深刻的行业洞察,助力您更深入地理解和应用大模型技术。
三、大模型经典PDF籍
随着人工智能技术的迅猛发展,AI大模型已成为当前科技领域的核心热点。像GPT-3、BERT、XLNet等大型预训练模型,凭借其卓越的语言理解与生成能力,正在重新定义我们对人工智能的认知。为了帮助大家更高效地学习和掌握这些技术,以下这些PDF资料将是极具价值的学习资源。

四、AI大模型商业化落地方案
AI大模型商业化落地方案聚焦于如何将先进的大模型技术转化为实际的商业价值。通过结合行业场景与市场需求,该方案为企业提供了从技术落地到盈利模式的完整路径,助力实现智能化升级与创新突破。

希望以上内容能对大家学习大模型有所帮助。如有需要,请微信扫描下方CSDN官方认证二维码免费领取相关资源【保证100%免费】。

祝大家学习顺利,抓住机遇,共创美好未来!
更多推荐



所有评论(0)