大模型介绍

大模型相关内容的介绍，让你不在困惑

lllsure · 2025-11-15 11:37:53 发布

在我上大学后，AI的热度逐渐提高。开始我不屑一顾，但是后来跟一些比较厉害的人交流后，发现我真的落后很多。别人在聊什么RAG，LLM，我："?"。

其实我也希望大家多去了解一些这些的新的东西，国外的大模型什么的该用用，花点钱什么关系的，以后都会赚回来的。

本篇文章对一些大模型常见的术语进行总结，看完至少能知道别人在聊的是个什么东西。

另外，本篇文章会一直进行补充，我学了什么，就会补充什么。

模型可以理解成一个从数据中学习规律的程序。你给它出了海量例子，并告诉它该怎么做。它通过这些例子可以自己总结出一些规则，学会了完成某个特定的任务。

模型的三个特点：

特定任务，一个模型通常只擅长一件事

需要标注数据，训练模型需要大量的标准答案

参数较少

大语言模型，LLM（Large Language Model）是指基于大规模神经网络（参数规模通常达数十亿至万亿级别，例如GPT-3包含1750亿参数），通过自监督或半监督方式，对海量文本进行训练的语言模型。

下面对一些专业属于进行解释：

1）神经网络

神经网络就是模仿人脑的工作模式。

它由大量虚拟的“神经元”（也就是参数）和连接组成。每个神经元都像⼀个小处理单元，负责处理一点点信息。无数个神经元分成很多层，前一层的输出作为后一层的输入。

通过海量数据的训练，这个网络会自己调整每个“神经元”的重要性（即参数的值），最终形成一个非常复杂的“判断流水线”。比如，一个识别猫的神经网络，某些参数可能专门负责识别猫的眼睛，另⼀些参数专门负责识别猫的轮廓。

简单说：神经网络就是⼀个通过数据训练出来的、由大量参数组成的复杂决策系统。

2）自监督学习

自己训练自己，从数据本身找规律

3）半监督学习

师傅领进门，修行在个人。用少量带标签的数据引模型入门，掌握一些基本规律，然后再根据这些规律，从海量数据中训练自己

4）语言模型

预测下一个词，判断接下来会说什么

提示词的编写相当重要，对于同一个模型，写好提示词跟没写好差距很大。就算你使用了目前最先进的大模型，写的提示词依托，等于没用。

还有，我们现在使用的大模型多是国内的，比如说DeepSeek、豆包啥的，都是免费的。但是，当我们调用API的时候就要花钱，每个字都是钱，因此减少不必要的沟通，减少不必要的输出是至关重要的。

写提示词的宗旨是：将你的问题限定范围，让 AI 知道你要的答案具体要包含什么，提示词效果会大幅提升。

1）CO-STAR 框架

在目标设定和问题解决的场景下，清晰性和结构性是至关重要的。

CO-STAR 可以拆解为六个维度。

模块	说明	示例
Context	任务背景与上下文	“你是电商客服，需解答用户关于iPhone 17的咨询，知识库包含最新价格和库存”
Objective	核心目标	“准确回答价格、发货时间，推荐适配配件”
Steps	执行步骤	“1. 识别用户问题类型；2. 检索知识库；3. 用亲切语气整理回复”
Tone	语言风格	“口语化，避免专业术语，使用‘亲~’‘呢’等语⽓词”
Audience	目标用户	“20-35岁年轻消费者，对价格敏感，关注性价比”
Response	输出格式	“价格：XXX元\n库存：XXX件\n推荐配件：XXX（链接）”