用 Google AI Studio 做一个「不乱编、不纵容」的结构化日报 Agent

本文记录了一次基于 Google AI Studio 的结构化日报 Agent 实验过程。通过实际对话测试，重点验证了大模型在信息不完整和存在风险信号时的行为表现，包括是否会主动追问、是否会补全未给出的内容，以及风险标记是否稳定。实验过程中对 Prompt 语言选择（英文规则 + 中文交互）、字段缺失处理策略（UNKNOWN vs 补全）以及“先约束再补全”和“先输出再确认”两种策略进行了对比分析

whweia

530人浏览 · 2026-01-16 11:40:19

whweia · 2026-01-16 11:40:19 发布

前言：为什么要做这个小项目

很多人做「日报生成 / 周报生成」，目标是写得好看、写得快。
但在项目里，我觉得日报真正的价值只有一个：

在提测之前，把“项目要失控”的信号提前暴露出来。

这次做这个 MVP 的目标不是“生成一份日报”，而是验证三件事：

大模型在信息不完整时，会不会乱补、乱猜
通过 Prompt + 结构约束，能否控制模型的风险行为
在高风险场景下，AI 应该“先追问”还是“先输出”

一、核心设计原则：先约束模型，再服务用户

1️⃣ Prompt 语言策略（非常关键）

结论先行：

规则 / 约束 / Schema：用英文
用户输入 / UI：用中文

原因很简单，也很工程化：

英文是大模型最核心的训练语料
在「否定条件 / 边界判断 / 不允许输出」这类逻辑上，
英文的稳定性显著高于中文
中文更适合表达业务语义，但不适合约束模型行为

一句话总结：

把“约束模型的语言”和“服务用户的语言”拆开，
不要为了中文可读性，牺牲模型行为的确定性。

2️⃣ 明确什么是“正确的不输出”

在 Prompt 中，我刻意定义了这些规则：

什么才算 plan
什么才算 blocker
在什么条件下 risk = HIGH
什么时候 UNKNOWN 是正确结果

这一步很重要，因为：

不输出 ≠ 能力不足
而是拒绝制造假数据

二、Prompt 设计（核心规则）

简化后的关键规则如下：

Requirements:
1) Ask user to provide a daily report, then output STRICT JSON only.
2) JSON fields:
   plan, actual, deviation(yes/no), blocker, impact, next_step,
   need_help(yes/no), risk_flag(HIGH/LOW)
3) If user input is missing, ask 1-3 short questions to fill missing fields.
4) risk_flag rules:
   - HIGH if deviation=yes OR blocker not empty OR impact mentions delay/risk
   - otherwise LOW
5) Keep output stable and consistent across turns.

这个 Prompt 的重点不是“字段多”，而是：