【2026】 LLM 大模型系统学习指南 (44)

AI 的作文比赛” 不是单纯让 AI 生成作文，而是以 “作文创作” 为场景，聚焦三大核心能力。通过让 AI 围绕指定主题生成高质量作文，再通过人工优化提示词、对比不同模型效果、建立评估标准，最终理解 “如何让 AI 精准匹配创作需求”，同时深化对生成式 AI 逻辑的理解 —— 这既是对提示词设计能力的训练，也是对 AI 生成内容质量把控能力的提升。

weixin_44673517

648人浏览 · 2026-02-04 10:26:20

weixin_44673517 · 2026-02-04 10:26:20 发布

都是 AI 的作文比赛 —— 提示词工程与 AI 写作优化实战

“AI 的作文比赛” 不是单纯让 AI 生成作文，而是以 “作文创作” 为场景，聚焦提示词工程、AI 生成优化、作文质量评估三大核心能力。通过让 AI 围绕指定主题生成高质量作文，再通过人工优化提示词、对比不同模型效果、建立评估标准，最终理解 “如何让 AI 精准匹配创作需求”，同时深化对生成式 AI 逻辑的理解 —— 这既是对提示词设计能力的训练，也是对 AI 生成内容质量把控能力的提升。

作业以高中常见作文主题为载体（如 “科技与生活”“青春成长”），兼顾 “技术实操” 与 “文学创作逻辑”，让不同基础的学习者都能在实战中掌握 AI 写作的核心方法。

一、作业核心目标

技术目标：掌握 AI 写作的提示词设计逻辑，能通过精准指令引导 AI 生成符合主题、结构完整、语言流畅的作文；
能力目标：学会对比不同 LLM 的写作风格，能通过迭代优化提示词解决 AI 作文的 “空洞、跑题、缺乏逻辑” 等问题；
思维目标：建立 “需求→提示词→生成→评估→优化” 的闭环思维，理解 “AI 是创作工具，人是核心决策者” 的协同逻辑。

二、核心任务拆解：从 “写作文” 到 “会用 AI 写好作文”

作业按 “基础→进阶→综合” 递进，所有任务围绕 “同一作文主题” 展开（推荐主题：高中议论文《科技发展与人文温度》），确保训练的连贯性：

1. 必做任务 1：基础提示词设计 —— 让 AI 生成合格作文

任务目标：

设计基础提示词，让 AI 生成一篇符合高中议论文要求的作文（800 字左右，结构完整：开头点题→分论点论证→结尾升华），避免跑题、结构混乱。

核心思路：

AI 写作的核心是 “提示词给 AI 明确的‘创作规则’”，基础提示词需包含 5 个关键要素：主题、文体、结构、字数、语言风格，缺一不可。

提示词设计模板（可直接复用）：

plaintext

### 作文要求：
1. 主题：《科技发展与人文温度》（议论文）；
2. 文体：高中议论文，符合高考作文评分标准（论点明确、论据充分、逻辑清晰）；
3. 结构：开头点题（引出科技与人文的关系）→ 2-3个分论点（每个分论点配具体论据，如案例、名言）→ 结尾升华（联系青年责任）；
4. 字数：800字左右（±50字）；
5. 语言风格：正式、流畅，避免口语化，适当使用修辞手法（比喻、排比），引用1-2句名言警句；
6. 论据要求：论据真实可信（如具体科技案例、历史人物事迹），避免虚构。

### 输出：
完整的800字议论文，分段落呈现（开头、每个分论点、结尾各为一段）。

实操代码（用 Llama 3 生成作文）：

python

运行

# 安装依赖
# pip install transformers torch

from transformers import AutoTokenizer, AutoModelForCausalLM

# 加载模型（轻量级，适合作文生成）
model_name = "meta-llama/Llama-3.2-8B-Instruct"
tokenizer = AutoTokenizer.from_pretrained(model_name)
tokenizer.pad_token = tokenizer.eos_token

model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype=torch.float16,
    device_map="auto",
    load_in_8bit=True  # 8bit量化，节省显存
)

# 输入提示词（替换为上面的作文要求）
prompt = """### 作文要求：
1. 主题：《科技发展与人文温度》（议论文）；
2. 文体：高中议论文，符合高考作文评分标准（论点明确、论据充分、逻辑清晰）；
3. 结构：开头点题（引出科技与人文的关系）→ 2-3个分论点（每个分论点配具体论据，如案例、名言）→ 结尾升华（联系青年责任）；
4. 字数：800字左右（±50字）；
5. 语言风格：正式、流畅，避免口语化，适当使用修辞手法（比喻、排比），引用1-2句名言警句；
6. 论据要求：论据真实可信（如具体科技案例、历史人物事迹），避免虚构。

### 输出：
完整的800字议论文，分段落呈现（开头、每个分论点、结尾各为一段）。"""

# 生成作文
inputs = tokenizer(
    prompt,
    return_tensors="pt",
    truncation=True,
    max_length=1024
).to(model.device)

with torch.no_grad():
    outputs = model.generate(
        **inputs,
        max_new_tokens=1000,  # 预留足够长度生成800字作文
        temperature=0.4,  # 降低随机性，保证逻辑连贯
        top_p=0.9,
        repetition_penalty=1.2  # 避免重复语句
    )

# 解码并保存作文
essay = tokenizer.decode(outputs[0], skip_special_tokens=True).split("### 输出：")[-1].strip()
print("AI生成的作文：")
print(essay)

# 保存到文件
with open("ai_essay_basic.txt", "w", encoding="utf-8") as f:
    f.write(essay)

任务交付要求：

提交生成的作文文本（标注 “基础提示词版”）；
附 100 字分析：说明作文是否符合要求（主题、结构、字数、论据），存在哪些问题（如分论点不清晰、论据不具体）。

2. 必做任务 2：提示词优化 —— 让 AI 生成优质作文

任务目标：

针对基础版作文的问题，优化提示词，让 AI 生成 “高分作文”（论点更深刻、论据更具体、语言更生动），解决 “空洞、论据不足、逻辑松散” 等问题。

核心优化思路：

在基础提示词的基础上，增加细节约束和示例引导，让 AI 更明确 “优质作文的标准”：

细化分论点方向（如 “科技发展需以人文为根基”“人文温度让科技更有价值”）；
指定论据类型（如 “近期科技案例”“名人名言”“社会现象”）；
加入语言细节要求（如 “每个分论点开头用排比句引领”“结尾联系新时代青年使命”）。

优化后的提示词模板：

plaintext

### 作文要求：
1. 主题：《科技发展与人文温度》（议论文）；
2. 文体：高中高分议论文（符合高考一类文标准）；
3. 结构：
   - 开头（100字）：用比喻修辞点题（如“科技是船，人文是帆”），引出核心论点“科技发展与人文温度相辅相成，缺一不可”；
   - 分论点1（200字）：科技发展需以人文为根基（论据：ChatGPT的伦理规范、某科技公司“老人友好型产品”案例）；
   - 分论点2（200字）：人文温度让科技更有价值（论据：袁隆平杂交水稻技术的人文关怀、医疗AI辅助偏远地区诊断的案例）；
   - 分论点3（200字）：青年当兼顾科技创新与人文素养（论据：95后工程师研发无障碍科技产品的事迹）；
   - 结尾（100字）：升华主题，引用名言（如“科技是第一生产力，而人文是科技的灵魂”），联系青年责任。
4. 字数：800字左右（±50字）；
5. 语言风格：正式流畅，多用排比、比喻修辞，分论点开头用“科技为翼，人文为根”“人文为魂，科技为器”等对仗句式；
6. 论据要求：论据为近3年的真实案例（如2023-2025年的科技事件），避免陈旧案例（如爱迪生发明电灯）。

### 输出：
完整的800字议论文，分段落呈现，标注每个部分（开头、分论点1-3、结尾）。

实操与对比：

用优化后的提示词重新生成作文（标注 “优化提示词版”）；
对比基础版和优化版的差异，重点分析：分论点是否更清晰、论据是否更具体、语言是否更生动。

任务交付要求：

提交优化版作文文本；
提交 “对比分析表”（如下表）：

评估维度	基础版作文	优化版作文	优化原因
分论点清晰度	模糊，无明确逻辑关联	明确，呈 “根基→价值→责任” 递进	提示词指定了分论点方向
论据具体性	论据陈旧（如爱因斯坦案例）	论据新颖（近 3 年科技案例）	提示词限定了论据时间范围
语言生动性	平淡，无修辞	多用排比、比喻，句式对仗	提示词明确了修辞要求
结构完整性	结尾未升华	结尾联系青年责任，升华主题	提示词指定了结尾要求

3. 进阶任务 3：多模型对比 —— 选最优 AI “笔友”

任务目标：

用相同的优化提示词，测试 3 个不同的开源 LLM（如 Llama 3-8B、ChatGLM-6B、Qwen-7B），对比它们的作文生成效果，选出最适合高中作文场景的模型。

核心对比维度：

对比维度	评分标准（1-5 分）
主题契合度	5 分：完全扣题；3 分：基本扣题；1 分：跑题
逻辑连贯性	5 分：分论点递进清晰；3 分：逻辑基本通顺；1 分：混乱
论据真实性	5 分：论据真实新颖；3 分：论据真实但陈旧；1 分：虚构
语言流畅性	5 分：流畅生动，有修辞；3 分：基本流畅；1 分：语句不通
符合要求度	5 分：完全符合结构、字数要求；3 分：基本符合；1 分：严重不符

实操代码（以 ChatGLM-6B 为例）：

python

运行

# 安装依赖（若未安装）
# pip install transformers torch accelerate

from transformers import AutoTokenizer, AutoModel

# 加载ChatGLM-6B模型
model_name = "THUDM/chatglm-6b"
tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
model = AutoModel.from_pretrained(
    model_name,
    trust_remote_code=True,
    torch_dtype=torch.float16,
    device_map="auto"
).half()

# 输入优化后的提示词（同任务2）
prompt = """### 作文要求：
1. 主题：《科技发展与人文温度》（议论文）；
2. 文体：高中高分议论文（符合高考一类文标准）；
3. 结构：
   - 开头（100字）：用比喻修辞点题（如“科技是船，人文是帆”），引出核心论点“科技发展与人文温度相辅相成，缺一不可”；
   - 分论点1（200字）：科技发展需以人文为根基（论据：ChatGPT的伦理规范、某科技公司“老人友好型产品”案例）；
   - 分论点2（200字）：人文温度让科技更有价值（论据：袁隆平杂交水稻技术的人文关怀、医疗AI辅助偏远地区诊断的案例）；
   - 分论点3（200字）：青年当兼顾科技创新与人文素养（论据：95后工程师研发无障碍科技产品的事迹）；
   - 结尾（100字）：升华主题，引用名言（如“科技是第一生产力，而人文是科技的灵魂”），联系青年责任。
4. 字数：800字左右（±50字）；
5. 语言风格：正式流畅，多用排比、比喻修辞，分论点开头用“科技为翼，人文为根”“人文为魂，科技为器”等对仗句式；
6. 论据要求：论据为近3年的真实案例（如2023-2025年的科技事件），避免陈旧案例（如爱迪生发明电灯）。

### 输出：
完整的800字议论文，分段落呈现，标注每个部分（开头、分论点1-3、结尾）。"""

# 生成作文
response, history = model.chat(tokenizer, prompt, history=[], max_length=1200)
print("ChatGLM-6B生成的作文：")
print(response)

# 保存作文
with open("ai_essay_chatglm.txt", "w", encoding="utf-8") as f:
    f.write(response)

任务交付要求：

提交 3 个模型的作文文本（分别标注模型名称）；
提交 “多模型对比评分表”（按上述维度评分）；
附 200 字结论：说明哪个模型最适合高中作文生成，原因是什么（如 “ChatGLM-6B 语言更符合中文表达习惯，论据更具体”）。

4. 选做任务 4：AI 作文鉴别 —— 区分 “AI 写的” 和 “人写的”

任务目标：

给定 5 篇作文（3 篇 AI 生成，2 篇人类高中生写的），用 “人工分析 + 工具验证” 的方式，准确鉴别每篇的来源，鉴别准确率≥80%，深化对 AI 写作特征的理解。

核心鉴别思路：

AI 作文的典型特征（结合高中作文场景）：

语言过于 “完美”：无错别字、无口语化表达、句式结构单一（多为书面语，缺乏个人风格）；
论据 “模板化”：多为常见案例（如 ChatGPT、袁隆平），缺乏个性化论据（如个人经历、小众案例）；
逻辑 “表面流畅”：分论点看似递进，但缺乏深度关联（如 “科技需人文” 和 “人文促科技” 的论证重复）；
细节 “空洞”：对案例的描述过于笼统（如 “某科技公司推出了友好产品”），无具体细节（如产品名称、效果）。

工具验证（复用作业 1 的文本鉴别模型）：

python

运行

# 加载文本鉴别模型
from transformers import pipeline

classifier = pipeline(
    "text-classification",
    model="roberta-base-openai-detector",
    return_all_scores=True
)

# 待鉴别作文（以人类写的作文为例）
human_essay = """《科技发展与人文温度》
科技是船，人文是帆。没有帆的船，即便动力再强，也终将迷失方向；没有船的帆，即便设计再巧，也只能随波逐流。科技发展与人文温度，从来都是相辅相成的共同体。

科技发展需以人文为根基。去年，老家的爷爷学会了用智能手机视频通话，这背后是某手机品牌专门为老年人优化的“大字体、简操作”功能——没有对老年人需求的人文关怀，再先进的通信技术也难以走进千家万户。ChatGPT的研发团队同样注重伦理边界，通过设置“禁止生成有害内容”的规则，让科技始终服务于人类的美好需求。这告诉我们：科技的初心是以人为本，脱离人文的科技，终将失去价值。

人文温度让科技更有价值。袁隆平院士研发杂交水稻，不仅是为了提高粮食产量，更是为了“让所有人远离饥饿”的人文情怀；医疗AI在偏远地区的应用，让山区患者不用奔波就能享受到优质诊断服务，这正是科技与人文结合的生动体现。科技是冰冷的代码和机器，但人文温度能让它变得有温度、有力量。

青年当兼顾科技创新与人文素养。作为一名高中生，我曾参与学校的“无障碍科技”社团，和同学一起为社区老人设计了“语音控制的智能灯”——既用到了Python编程知识，又传递了对老人的关怀。新时代的青年，既要学好科技知识，又要常怀人文之心，让科技成为传递温暖的桥梁。

“科技是第一生产力，而人文是科技的灵魂。” 科技发展的终极目标，是让人类生活更美好。当科技插上人文的翅膀，当人文融入科技的血脉，我们必将迎来一个既先进又温暖的未来。"""

# 鉴别
results = classifier(human_essay)[0]
ai_score = next(s for s in results if s["label"] == "LABEL_1")["score"]
print(f"AI生成概率：{ai_score:.4f}")
print(f"鉴别结论：{'AI生成' if ai_score > 0.5 else '人类创作'}")

任务交付要求：

提交 5 篇作文的鉴别报告（含作文文本、人工分析特征、工具预测概率、最终结论）；
附 150 字分析：总结 AI 作文的核心鉴别特征，说明哪些特征最容易误判（如 “高分人类作文语言也很流畅，容易被误判为 AI 生成”）。

三、AI 作文生成的核心逻辑：提示词是 “方向盘”，人是 “驾驶员”

提示词的核心作用：给 AI 明确的 “创作边界” 和 “质量标准”—— 边界越清晰（如分论点方向、论据类型），AI 的输出越精准；标准越具体（如语言风格、结构细节），AI 的输出质量越高；
AI 的局限性：AI 只能基于训练数据中的 “作文模板” 和 “案例库” 生成内容，缺乏真实的生活体验和深度思考 —— 因此，高分作文的核心仍需人的参与（如提供个性化案例、深化分论点逻辑）；
人机协同的本质：AI 负责 “完成基础框架和文字填充”，人负责 “定义主题、优化逻辑、补充细节、注入情感”—— 两者结合，才能既高效又高质量地完成作文创作。

四、作业避坑指南：4 大常见问题解决方案

AI 作文跑题：
- 原因：提示词未明确主题核心（如只说 “科技与人文”，未说 “相辅相成”）；
- 解决：在提示词中直接给出 “核心论点”，并要求每个分论点都围绕核心论点展开。
作文内容空洞、论据不足：
- 原因：提示词未指定论据类型或案例范围；
- 解决：明确要求 “具体案例 + 细节描述”（如 “某手机品牌的‘老人模式’，让 80% 的老人学会了视频通话”），避免笼统表述。
语言风格不符合高中作文要求：
- 原因：提示词未限定语言风格（如 AI 生成过于学术化或口语化的内容）；
- 解决：加入 “语言参考示例”（如 “分论点开头用‘科技为 X，人文为 Y’的对仗句式”），让 AI 更明确风格。
多模型对比时评分不准：
- 原因：评分标准过于主观（如 “语言生动性” 无明确依据）；
- 解决：细化评分标准（如 “语言生动性：5 分 = 每段至少 1 种修辞，3 分 = 有修辞但不自然，1 分 = 无修辞”），减少主观误差。

五、拓展思考：AI 写作对学习的启示

AI 是 “辅助工具”，而非 “替代者”：高中作文的核心是考察 “逻辑思维、语言表达、价值观念”，AI 能帮我们完成文字填充，但无法替代我们的深度思考和情感注入 —— 比如个人经历、独特观点等个性化内容，仍需人来提供；
提示词设计能力 =“清晰表达需求” 的能力：训练 AI 写作的过程，本质是训练 “如何清晰、具体地表达自己的需求”—— 这不仅是 AI 使用能力，更是未来学习和工作的核心能力；
鉴别 AI 作文的能力 =“批判性思维” 的能力：学会区分 AI 生成内容，能让我们更理性地使用 AI，避免过度依赖，同时培养 “质疑、验证、分析” 的批判性思维。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

从单体到微服务：AI架构师详解大规模AI系统部署的架构演进路径与策略

想象一下，在一个繁华的大都市中，有一座超级庞大的建筑，它就像一个单体的巨兽，承担着城市里所有的办公、居住、娱乐等功能。这座建筑虽然功能强大，但一旦某个部分出现故障，可能会影响到整个建筑的正常运转，而且想要对其进行改造和升级也非常困难。这就如同传统的单体AI系统，一个庞大的程序包含了所有的功能，虽然能完成复杂的任务，但在灵活性、可维护性等方面存在诸多问题。随着科技的发展，城市开始出现了许多小型的、功