【ACP-LLM】大模型篇 4

本章介绍了让大模型回答私域知识问题的初步方案，该方案的核心瓶颈——有限的上下文窗口以及解决之道——上下文工程。

weixin_47173810

1009人浏览 · 2026-01-26 17:11:58

weixin_47173810 · 2026-01-26 17:11:58 发布

⚙️ 3. 让大模型能够回答私域知识问题

回到最初的挑战：
答疑机器人无法回答“我们公司项目管理用什么工具”这类内部问题。
根本原因在于，大模型的知识来源于其训练数据，这些数据通常是公开的互联网信息，不包含任何特定公司的内部文档、政策或流程。

你可以把大模型想象成一台刚出厂的超级计算机：
它的 CPU（推理能力）极其强大，硬盘（模型权重）里也预装了海量的通用知识。
但对于你公司的“内部资料”，它的硬盘里是空白的。

面对这个问题，最直观的解决思路就是：
在运行时，把公司的内部知识临时告诉它。

3.1 初步方案：在提示词中“喂”入知识

你可以来验证这个思路：将公司项目管理工具的说明文档，直接添加到给模型的指令（System Prompt）中，作为背景知识提供给它。

user_question = "我是软件一组的，请问项目管理应该用什么工具"

knowledge = """公司项目管理工具有两种选择：
  1. **Jira**：对于软件开发团队来说，Jira 是一个非常强大的工具，支持敏捷开发方法，如Scrum和Kanban。它提供了丰富的功能，包括问题跟踪、时间跟踪等。

  2. **Microsoft Project**：对于大型企业或复杂项目，Microsoft Project 提供了详细的计划制定、资源分配和成本控制等功能。它更适合那些需要严格控制项目时间和成本的场景。

  在一般情况下请使用Microsoft Project，公司购买了完整的许可证。软件研发一组、三组和四组正在使用Jira，计划于2026年之前逐步切换至Microsoft Project.
"""

response = get_qwen_stream_response(
  user_prompt=user_question,
  # 将公司项目管理工具相关的知识作为背景信息传入系统提示词
  system_prompt="你负责教育内容开发公司的答疑，你的名字叫公司小蜜，你要回答学员的问题。" + knowledge,
  temperature=0.7,
  top_p=0.8
)

for chunk in response:
  print(chunk, end="")

模型输出：

你好呀，我是公司小蜜～欢迎来咨询！

你是软件一组的小伙伴对吧？目前你们组还在使用 **Jira** 进行项目管理，这是当前阶段允许的，因为你们属于正在使用 Jira 的研发团队之一（软件研发一组、三组、四组）。

不过要悄悄告诉你一个小目标：**公司计划在2026年之前逐步从 Jira 切换到 Microsoft Project**。后续会根据安排推进工具统一，所以未来可能会开始过渡使用 Microsoft Project。

现阶段你继续用 Jira 没问题，但如果有新项目试点或培训通知，记得关注哦，我们会提前安排支持和培训，确保大家顺利切换～

如果现在就想了解 Microsoft Project 的基本操作，我也可以帮你找资料哟！😊

加油工作，小蜜随时在线～

实验成功了！
在提示词中加入相关的背景知识，大模型确实能够准确回答关于公司内部工具的问题。
这个发现令人振奋，似乎你已经找到了解决私域知识问答的钥匙。

然而，当你试图将更多的公司文档（例如几十页的员工手册、上百页的技术规范）都用这种方式“喂”给大模型时，一个新的、更严峻的挑战出现了。

3.2 核心瓶颈：有限的上下文窗口

在这里插入图片描述
大模型接收我们输入（包括指令、问题和背景知识）的地方，被称为上下文窗口（Context Window）。
你可以把它理解为计算机的“内存（RAM）”——它的容量是有限的。
你无法将整个公司的知识库（成百上千份文档）一次性塞进这个有限的窗口里。
一旦输入内容超过模型的最大限制，就会导致错误。
这引出了一个核心问题：你需要对放入上下文窗口的内容进行筛选和管理。