都是 AI 的作文比赛 —— 提示词工程与 AI 写作优化实战

“AI 的作文比赛” 不是单纯让 AI 生成作文,而是以 “作文创作” 为场景,聚焦提示词工程、AI 生成优化、作文质量评估三大核心能力。通过让 AI 围绕指定主题生成高质量作文,再通过人工优化提示词、对比不同模型效果、建立评估标准,最终理解 “如何让 AI 精准匹配创作需求”,同时深化对生成式 AI 逻辑的理解 —— 这既是对提示词设计能力的训练,也是对 AI 生成内容质量把控能力的提升。

作业以高中常见作文主题为载体(如 “科技与生活”“青春成长”),兼顾 “技术实操” 与 “文学创作逻辑”,让不同基础的学习者都能在实战中掌握 AI 写作的核心方法。

一、作业核心目标

  1. 技术目标:掌握 AI 写作的提示词设计逻辑,能通过精准指令引导 AI 生成符合主题、结构完整、语言流畅的作文;
  2. 能力目标:学会对比不同 LLM 的写作风格,能通过迭代优化提示词解决 AI 作文的 “空洞、跑题、缺乏逻辑” 等问题;
  3. 思维目标:建立 “需求→提示词→生成→评估→优化” 的闭环思维,理解 “AI 是创作工具,人是核心决策者” 的协同逻辑。

二、核心任务拆解:从 “写作文” 到 “会用 AI 写好作文”

作业按 “基础→进阶→综合” 递进,所有任务围绕 “同一作文主题” 展开(推荐主题:高中议论文《科技发展与人文温度》),确保训练的连贯性:

1. 必做任务 1:基础提示词设计 —— 让 AI 生成合格作文

任务目标:

设计基础提示词,让 AI 生成一篇符合高中议论文要求的作文(800 字左右,结构完整:开头点题→分论点论证→结尾升华),避免跑题、结构混乱。

核心思路:

AI 写作的核心是 “提示词给 AI 明确的‘创作规则’”,基础提示词需包含 5 个关键要素:主题、文体、结构、字数、语言风格,缺一不可。

提示词设计模板(可直接复用):

plaintext

### 作文要求:
1. 主题:《科技发展与人文温度》(议论文);
2. 文体:高中议论文,符合高考作文评分标准(论点明确、论据充分、逻辑清晰);
3. 结构:开头点题(引出科技与人文的关系)→ 2-3个分论点(每个分论点配具体论据,如案例、名言)→ 结尾升华(联系青年责任);
4. 字数:800字左右(±50字);
5. 语言风格:正式、流畅,避免口语化,适当使用修辞手法(比喻、排比),引用1-2句名言警句;
6. 论据要求:论据真实可信(如具体科技案例、历史人物事迹),避免虚构。

### 输出:
完整的800字议论文,分段落呈现(开头、每个分论点、结尾各为一段)。
实操代码(用 Llama 3 生成作文):

python

运行

# 安装依赖
# pip install transformers torch

from transformers import AutoTokenizer, AutoModelForCausalLM

# 加载模型(轻量级,适合作文生成)
model_name = "meta-llama/Llama-3.2-8B-Instruct"
tokenizer = AutoTokenizer.from_pretrained(model_name)
tokenizer.pad_token = tokenizer.eos_token

model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype=torch.float16,
    device_map="auto",
    load_in_8bit=True  # 8bit量化,节省显存
)

# 输入提示词(替换为上面的作文要求)
prompt = """### 作文要求:
1. 主题:《科技发展与人文温度》(议论文);
2. 文体:高中议论文,符合高考作文评分标准(论点明确、论据充分、逻辑清晰);
3. 结构:开头点题(引出科技与人文的关系)→ 2-3个分论点(每个分论点配具体论据,如案例、名言)→ 结尾升华(联系青年责任);
4. 字数:800字左右(±50字);
5. 语言风格:正式、流畅,避免口语化,适当使用修辞手法(比喻、排比),引用1-2句名言警句;
6. 论据要求:论据真实可信(如具体科技案例、历史人物事迹),避免虚构。

### 输出:
完整的800字议论文,分段落呈现(开头、每个分论点、结尾各为一段)。"""

# 生成作文
inputs = tokenizer(
    prompt,
    return_tensors="pt",
    truncation=True,
    max_length=1024
).to(model.device)

with torch.no_grad():
    outputs = model.generate(
        **inputs,
        max_new_tokens=1000,  # 预留足够长度生成800字作文
        temperature=0.4,  # 降低随机性,保证逻辑连贯
        top_p=0.9,
        repetition_penalty=1.2  # 避免重复语句
    )

# 解码并保存作文
essay = tokenizer.decode(outputs[0], skip_special_tokens=True).split("### 输出:")[-1].strip()
print("AI生成的作文:")
print(essay)

# 保存到文件
with open("ai_essay_basic.txt", "w", encoding="utf-8") as f:
    f.write(essay)
任务交付要求:
  • 提交生成的作文文本(标注 “基础提示词版”);
  • 附 100 字分析:说明作文是否符合要求(主题、结构、字数、论据),存在哪些问题(如分论点不清晰、论据不具体)。

2. 必做任务 2:提示词优化 —— 让 AI 生成优质作文

任务目标:

针对基础版作文的问题,优化提示词,让 AI 生成 “高分作文”(论点更深刻、论据更具体、语言更生动),解决 “空洞、论据不足、逻辑松散” 等问题。

核心优化思路:

在基础提示词的基础上,增加细节约束示例引导,让 AI 更明确 “优质作文的标准”:

  1. 细化分论点方向(如 “科技发展需以人文为根基”“人文温度让科技更有价值”);
  2. 指定论据类型(如 “近期科技案例”“名人名言”“社会现象”);
  3. 加入语言细节要求(如 “每个分论点开头用排比句引领”“结尾联系新时代青年使命”)。
优化后的提示词模板:

plaintext

### 作文要求:
1. 主题:《科技发展与人文温度》(议论文);
2. 文体:高中高分议论文(符合高考一类文标准);
3. 结构:
   - 开头(100字):用比喻修辞点题(如“科技是船,人文是帆”),引出核心论点“科技发展与人文温度相辅相成,缺一不可”;
   - 分论点1(200字):科技发展需以人文为根基(论据:ChatGPT的伦理规范、某科技公司“老人友好型产品”案例);
   - 分论点2(200字):人文温度让科技更有价值(论据:袁隆平杂交水稻技术的人文关怀、医疗AI辅助偏远地区诊断的案例);
   - 分论点3(200字):青年当兼顾科技创新与人文素养(论据:95后工程师研发无障碍科技产品的事迹);
   - 结尾(100字):升华主题,引用名言(如“科技是第一生产力,而人文是科技的灵魂”),联系青年责任。
4. 字数:800字左右(±50字);
5. 语言风格:正式流畅,多用排比、比喻修辞,分论点开头用“科技为翼,人文为根”“人文为魂,科技为器”等对仗句式;
6. 论据要求:论据为近3年的真实案例(如2023-2025年的科技事件),避免陈旧案例(如爱迪生发明电灯)。

### 输出:
完整的800字议论文,分段落呈现,标注每个部分(开头、分论点1-3、结尾)。
实操与对比:
  • 用优化后的提示词重新生成作文(标注 “优化提示词版”);
  • 对比基础版和优化版的差异,重点分析:分论点是否更清晰、论据是否更具体、语言是否更生动。
任务交付要求:
  • 提交优化版作文文本;
  • 提交 “对比分析表”(如下表):
评估维度 基础版作文 优化版作文 优化原因
分论点清晰度 模糊,无明确逻辑关联 明确,呈 “根基→价值→责任” 递进 提示词指定了分论点方向
论据具体性 论据陈旧(如爱因斯坦案例) 论据新颖(近 3 年科技案例) 提示词限定了论据时间范围
语言生动性 平淡,无修辞 多用排比、比喻,句式对仗 提示词明确了修辞要求
结构完整性 结尾未升华 结尾联系青年责任,升华主题 提示词指定了结尾要求

3. 进阶任务 3:多模型对比 —— 选最优 AI “笔友”

任务目标:

用相同的优化提示词,测试 3 个不同的开源 LLM(如 Llama 3-8B、ChatGLM-6B、Qwen-7B),对比它们的作文生成效果,选出最适合高中作文场景的模型。

核心对比维度:
对比维度 评分标准(1-5 分)
主题契合度 5 分:完全扣题;3 分:基本扣题;1 分:跑题
逻辑连贯性 5 分:分论点递进清晰;3 分:逻辑基本通顺;1 分:混乱
论据真实性 5 分:论据真实新颖;3 分:论据真实但陈旧;1 分:虚构
语言流畅性 5 分:流畅生动,有修辞;3 分:基本流畅;1 分:语句不通
符合要求度 5 分:完全符合结构、字数要求;3 分:基本符合;1 分:严重不符
实操代码(以 ChatGLM-6B 为例):

python

运行

# 安装依赖(若未安装)
# pip install transformers torch accelerate

from transformers import AutoTokenizer, AutoModel

# 加载ChatGLM-6B模型
model_name = "THUDM/chatglm-6b"
tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
model = AutoModel.from_pretrained(
    model_name,
    trust_remote_code=True,
    torch_dtype=torch.float16,
    device_map="auto"
).half()

# 输入优化后的提示词(同任务2)
prompt = """### 作文要求:
1. 主题:《科技发展与人文温度》(议论文);
2. 文体:高中高分议论文(符合高考一类文标准);
3. 结构:
   - 开头(100字):用比喻修辞点题(如“科技是船,人文是帆”),引出核心论点“科技发展与人文温度相辅相成,缺一不可”;
   - 分论点1(200字):科技发展需以人文为根基(论据:ChatGPT的伦理规范、某科技公司“老人友好型产品”案例);
   - 分论点2(200字):人文温度让科技更有价值(论据:袁隆平杂交水稻技术的人文关怀、医疗AI辅助偏远地区诊断的案例);
   - 分论点3(200字):青年当兼顾科技创新与人文素养(论据:95后工程师研发无障碍科技产品的事迹);
   - 结尾(100字):升华主题,引用名言(如“科技是第一生产力,而人文是科技的灵魂”),联系青年责任。
4. 字数:800字左右(±50字);
5. 语言风格:正式流畅,多用排比、比喻修辞,分论点开头用“科技为翼,人文为根”“人文为魂,科技为器”等对仗句式;
6. 论据要求:论据为近3年的真实案例(如2023-2025年的科技事件),避免陈旧案例(如爱迪生发明电灯)。

### 输出:
完整的800字议论文,分段落呈现,标注每个部分(开头、分论点1-3、结尾)。"""

# 生成作文
response, history = model.chat(tokenizer, prompt, history=[], max_length=1200)
print("ChatGLM-6B生成的作文:")
print(response)

# 保存作文
with open("ai_essay_chatglm.txt", "w", encoding="utf-8") as f:
    f.write(response)
任务交付要求:
  • 提交 3 个模型的作文文本(分别标注模型名称);
  • 提交 “多模型对比评分表”(按上述维度评分);
  • 附 200 字结论:说明哪个模型最适合高中作文生成,原因是什么(如 “ChatGLM-6B 语言更符合中文表达习惯,论据更具体”)。

4. 选做任务 4:AI 作文鉴别 —— 区分 “AI 写的” 和 “人写的”

任务目标:

给定 5 篇作文(3 篇 AI 生成,2 篇人类高中生写的),用 “人工分析 + 工具验证” 的方式,准确鉴别每篇的来源,鉴别准确率≥80%,深化对 AI 写作特征的理解。

核心鉴别思路:

AI 作文的典型特征(结合高中作文场景):

  1. 语言过于 “完美”:无错别字、无口语化表达、句式结构单一(多为书面语,缺乏个人风格);
  2. 论据 “模板化”:多为常见案例(如 ChatGPT、袁隆平),缺乏个性化论据(如个人经历、小众案例);
  3. 逻辑 “表面流畅”:分论点看似递进,但缺乏深度关联(如 “科技需人文” 和 “人文促科技” 的论证重复);
  4. 细节 “空洞”:对案例的描述过于笼统(如 “某科技公司推出了友好产品”),无具体细节(如产品名称、效果)。
工具验证(复用作业 1 的文本鉴别模型):

python

运行

# 加载文本鉴别模型
from transformers import pipeline

classifier = pipeline(
    "text-classification",
    model="roberta-base-openai-detector",
    return_all_scores=True
)

# 待鉴别作文(以人类写的作文为例)
human_essay = """《科技发展与人文温度》
科技是船,人文是帆。没有帆的船,即便动力再强,也终将迷失方向;没有船的帆,即便设计再巧,也只能随波逐流。科技发展与人文温度,从来都是相辅相成的共同体。

科技发展需以人文为根基。去年,老家的爷爷学会了用智能手机视频通话,这背后是某手机品牌专门为老年人优化的“大字体、简操作”功能——没有对老年人需求的人文关怀,再先进的通信技术也难以走进千家万户。ChatGPT的研发团队同样注重伦理边界,通过设置“禁止生成有害内容”的规则,让科技始终服务于人类的美好需求。这告诉我们:科技的初心是以人为本,脱离人文的科技,终将失去价值。

人文温度让科技更有价值。袁隆平院士研发杂交水稻,不仅是为了提高粮食产量,更是为了“让所有人远离饥饿”的人文情怀;医疗AI在偏远地区的应用,让山区患者不用奔波就能享受到优质诊断服务,这正是科技与人文结合的生动体现。科技是冰冷的代码和机器,但人文温度能让它变得有温度、有力量。

青年当兼顾科技创新与人文素养。作为一名高中生,我曾参与学校的“无障碍科技”社团,和同学一起为社区老人设计了“语音控制的智能灯”——既用到了Python编程知识,又传递了对老人的关怀。新时代的青年,既要学好科技知识,又要常怀人文之心,让科技成为传递温暖的桥梁。

“科技是第一生产力,而人文是科技的灵魂。” 科技发展的终极目标,是让人类生活更美好。当科技插上人文的翅膀,当人文融入科技的血脉,我们必将迎来一个既先进又温暖的未来。"""

# 鉴别
results = classifier(human_essay)[0]
ai_score = next(s for s in results if s["label"] == "LABEL_1")["score"]
print(f"AI生成概率:{ai_score:.4f}")
print(f"鉴别结论:{'AI生成' if ai_score > 0.5 else '人类创作'}")
任务交付要求:
  • 提交 5 篇作文的鉴别报告(含作文文本、人工分析特征、工具预测概率、最终结论);
  • 附 150 字分析:总结 AI 作文的核心鉴别特征,说明哪些特征最容易误判(如 “高分人类作文语言也很流畅,容易被误判为 AI 生成”)。

三、AI 作文生成的核心逻辑:提示词是 “方向盘”,人是 “驾驶员”

  1. 提示词的核心作用:给 AI 明确的 “创作边界” 和 “质量标准”—— 边界越清晰(如分论点方向、论据类型),AI 的输出越精准;标准越具体(如语言风格、结构细节),AI 的输出质量越高;
  2. AI 的局限性:AI 只能基于训练数据中的 “作文模板” 和 “案例库” 生成内容,缺乏真实的生活体验和深度思考 —— 因此,高分作文的核心仍需人的参与(如提供个性化案例、深化分论点逻辑);
  3. 人机协同的本质:AI 负责 “完成基础框架和文字填充”,人负责 “定义主题、优化逻辑、补充细节、注入情感”—— 两者结合,才能既高效又高质量地完成作文创作。

四、作业避坑指南:4 大常见问题解决方案

  1. AI 作文跑题

    • 原因:提示词未明确主题核心(如只说 “科技与人文”,未说 “相辅相成”);
    • 解决:在提示词中直接给出 “核心论点”,并要求每个分论点都围绕核心论点展开。
  2. 作文内容空洞、论据不足

    • 原因:提示词未指定论据类型或案例范围;
    • 解决:明确要求 “具体案例 + 细节描述”(如 “某手机品牌的‘老人模式’,让 80% 的老人学会了视频通话”),避免笼统表述。
  3. 语言风格不符合高中作文要求

    • 原因:提示词未限定语言风格(如 AI 生成过于学术化或口语化的内容);
    • 解决:加入 “语言参考示例”(如 “分论点开头用‘科技为 X,人文为 Y’的对仗句式”),让 AI 更明确风格。
  4. 多模型对比时评分不准

    • 原因:评分标准过于主观(如 “语言生动性” 无明确依据);
    • 解决:细化评分标准(如 “语言生动性:5 分 = 每段至少 1 种修辞,3 分 = 有修辞但不自然,1 分 = 无修辞”),减少主观误差。

五、拓展思考:AI 写作对学习的启示

  1. AI 是 “辅助工具”,而非 “替代者”:高中作文的核心是考察 “逻辑思维、语言表达、价值观念”,AI 能帮我们完成文字填充,但无法替代我们的深度思考和情感注入 —— 比如个人经历、独特观点等个性化内容,仍需人来提供;
  2. 提示词设计能力 =“清晰表达需求” 的能力:训练 AI 写作的过程,本质是训练 “如何清晰、具体地表达自己的需求”—— 这不仅是 AI 使用能力,更是未来学习和工作的核心能力;
  3. 鉴别 AI 作文的能力 =“批判性思维” 的能力:学会区分 AI 生成内容,能让我们更理性地使用 AI,避免过度依赖,同时培养 “质疑、验证、分析” 的批判性思维。
Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐