读懂模型的“性格”，才能用好AI！这篇深度解析，让你从“使用者”变成“驯兽师”！

**“** 每个模型都会有其独特的性格，我们需要理清不同模型的性格差异。**”**最近在优化智能体长对话功能中，为了解决长对话存在的问题，采用了更换模型的方式进行对比测试；测试在长对话中，模型对整个系统的影响到底有多大。然后就发现了一些很好玩的事情，也是不同模型之间的区别。

程序猿李巡天

565人浏览 · 2025-12-09 14:09:37

程序猿李巡天 · 2025-12-09 14:09:37 发布

“ 每个模型都会有其独特的性格，我们需要理清不同模型的性格差异。”

最近在优化智能体长对话功能中，为了解决长对话存在的问题，采用了更换模型的方式进行对比测试；测试在长对话中，模型对整个系统的影响到底有多大。

然后就发现了一些很好玩的事情，也是不同模型之间的区别。

模型对比测试

在测试智能体长对话过程中，使用了所有优化方式，但最终还是没有达到预设的效果；因此，这时就怀疑是不是模型的问题，换一个更大更强的模型是不是会更好一点。

在现有的大模型体系中，大家有一个明显的共识，那就是模型参数越多，模型越大功能就越强，当然消耗的算力也更多。

所以，现在的模型基本上都是多少多少B，这里B指的是十亿，所谓的14B就是140亿参数，32B就是320亿参数。

作者在测试中，先使用了14B的模型，30B的模型，80B的模型和最大235B的模型，从整体上来说除了14B之外，后面三个模型在对话场景中的差别并不是特别大。

只不过参数量越大，其行为模式越像人，但其思考的过程也越长，废话也越多；从测试的感受来看，越大的模型在交互上做得越好，当模型无法确认你的意图时，它会引导你做出更合适的输入；而这就是是小模型所无法比拟的。

但同样的，大模型也有大模型的问题，比如在使用235B的模型测试时发现，它会利用一部分参考数据，但也会根据自己的知识回答问题，而且从回复的内容来看，它自信心太强了，甚至有点过头。

而这在真实的业务场景中是不可取的，从这里也可以看出，模型并不是越大越好；从现有的模型设计来看，越大的模型越适合复杂的任务，但在简单的业务场景中，其表现可能并不一定会比小模型更好，甚至成本会更高，风险也更高。

其次，在大模型应用中模型作为一个可插拔组件，很多人都认为用小模型把流程和功能跑通，然后在生产环境直接切换大模型就可以了。

但经过今天的测试发现，每个模型由于训练数据和部署环境的不同，会导致不同的模型具备独特的风格；同样的提示词，同样的代码虽然在不同的模型上都能跑通；但效果上却可能天差地别。

所以，在真正的企业级环境中，我们需要针对不同的模型，进行适当的调整，特别是提示词和上下文；最好的方式就是，测试环境用什么模型，生产环境也用什么模型，这样才能尽可能的保证环境的切换对整个应用影响最小。

模型就像一个人，当它被训练完成之后，它就会具备其独特的风格，就类似于人的性格一样；除非对模型进行重新训练或微调，才能从根本上改变其“性格”。

而对待不同性格的人，需要使用不同的方式，同样对待模型也是如此；我们千万不能认为模型都是一样的，可以进行无缝切换。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

大模型 AI 能干什么？
大模型是怎样获得「智能」的？
用好 AI 的核心心法
大模型应用业务架构
大模型应用技术架构
代码示例：向 GPT-3.5 灌入新知识
提示工程的意义和核心思想
Prompt 典型构成
指令调优方法论
思维链和思维树
Prompt 攻击和防范
…

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

为什么要做 RAG
搭建一个简单的 ChatPDF
检索的基础概念
什么是向量表示（Embeddings）
向量数据库与向量检索
基于向量检索的 RAG
搭建 RAG 系统的扩展知识
混合检索与 RAG-Fusion 简介
向量模型本地部署
…

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

为什么要做 RAG
什么是模型
什么是模型训练
求解器 & 损失函数简介
小实验2：手写一个简单的神经网络并训练它
什么是训练/预训练/微调/轻量化微调
Transformer结构简介
轻量化微调
实验数据集的构建
…

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

硬件选型
带你了解全球大模型
使用国产大模型服务
搭建 OpenAI 代理
热身：基于阿里云 PAI 部署 Stable Diffusion
在本地计算机运行大模型
大模型的私有化部署
基于 vLLM 部署大模型
案例：如何优雅地在阿里云私有部署开源大模型
部署一套开源 LLM 项目
内容安全
互联网信息服务算法备案
…

学习是一个过程，只要学习就会有挑战。天道酬勤，你越努力，就会成为越优秀的自己。

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

在这里插入图片描述

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

QPainter 指南：绘制各种图形

可以在各种绘图设备上进行绘制。QPainter 是 Qt 的。

2048 AI社区

国内外AI模型优劣分析及举例

2025年AI领域呈现国内外多强竞争格局。国内AI聚焦中文场景和垂直领域，如月之暗面Kimi擅长长文本处理，百度文心一言依托搜索资源优势明显，DeepSeek在医疗金融等专业领域表现突出。国外AI以ChatGPT、Claude和Gemini为代表，在生态构建和多模态技术上领先，但中文适配性较弱。DeepSeek通过趣味应用降低使用门槛，同时在医疗和法律等专业领域提供精准服务，展现了国产AI&quo