【Spring AI & LangChain4j 基础篇】Prompt工程企业级落地：Spring AI & LangChain4j实战指南，搞定Java大模型开发核心痛点

这篇文章摘要如下：本文聚焦Java开发者在大模型应用落地中的Prompt工程实践，针对企业级应用中的常见痛点（如Prompt杂乱、输出不精准、Token消耗失控等），提出基于Spring AI和LangChain4j的解决方案。文章首先阐述了Prompt工程的四大核心原则：精准绑定业务场景、可控的上下文边界、多模型适配的可扩展性，以及兼顾Token消耗的效率优先。然后通过Spring资源管理实现

小可爱awo

999人浏览 · 2026-02-27 21:39:13

小可爱awo · 2026-02-27 21:39:13 发布

在这里插入图片描述

🍃 予枫：个人主页
📚 个人专栏: 《Java 从入门到起飞》《读研码农的干货日常》

💻 Debug 这个世界，Return 更好的自己！

引言

很多Java开发者做大模型应用，停留在“调用API跑通demo”的阶段，一到企业级落地就卡壳：Prompt写得杂乱无章、无法动态调整，结构化输出不精准，Token消耗失控，国内大模型适配困难… 本文聚焦Prompt工程的企业级落地，基于Spring AI与LangChain4j两大框架，拆解核心方法论与最佳实践，帮你从“能跑通”进阶到“能开发”，独立搞定中等复杂度大模型应用。

一、PROMPT工程核心原则：Java场景下的设计方法论

Prompt工程不是“写话术”，而是一套可复用、可落地的设计逻辑，尤其在Java企业级开发中，需兼顾可读性、可维护性与性能，核心围绕4大原则展开👇

1.1 精准性：拒绝“模糊表述”，绑定业务场景

核心逻辑：大模型的输出质量，取决于Prompt的“指令清晰度”，企业级场景需避免抽象描述，直接关联业务需求。

反例：“帮我处理用户的订单问题”（模糊，未明确处理范围、输出格式）
正例：“作为电商订单客服助手，接收用户的订单咨询（如物流、退款、改地址），需先确认订单号，再用简洁语言回复，不超过3行，拒绝无关内容”（精准绑定电商场景，明确交互规则）

在Java开发中，可结合业务枚举类，将场景化指令固化，避免重复编写Prompt，提升复用性。

1.2 上下文可控：限定边界，减少无效输出

企业级应用中，大模型的输出需符合业务规范，需通过Prompt限定“角色、边界、格式”三大要素：

角色设定：明确大模型的身份（如“资深Java架构师”“电商客服”），避免身份漂移；
边界限定：明确禁止输出的内容（如敏感信息、无关话题）；
格式限定：提前约定输出格式（如JSON、固定模板），便于后续解析。

1.3 可扩展性：适配多模型，预留调整空间

国内大模型（如智谱、通义千问）与国外模型（如GPT）的Prompt适配性不同，设计时需避免“模型专属语法”，采用通用指令，同时预留参数调整入口，便于切换模型时快速适配。

1.4 效率优先：兼顾Token消耗，降低成本

企业级应用需考虑Token消耗成本，Prompt设计需“精简有效”：去除冗余描述，核心指令前置，避免无意义的铺垫，同时通过少样本提示，减少重复指令的Token占用。

✨ 小提示：觉得这部分原则实用的话，不妨点赞收藏，后续开发直接套用～

二、模板化管理：Spring资源管理实现Prompt配置化

在Java项目中，若Prompt硬编码在代码中，会导致维护成本高、无法动态调整，通过Spring的资源管理能力，可实现Prompt的配置化、动态参数注入，适配企业级场景的灵活需求。

2.1 核心实现思路

将Prompt模板存储在resources目录下（如.properties、.txt文件），按业务模块分类；
利用Spring的ResourceLoader加载模板，通过占位符（如${param}）预留动态参数；
封装Prompt工具类，实现模板读取、参数替换、缓存管理，提升性能。

2.2 代码实战（Spring AI）

// 1. Prompt模板配置（resources/prompt/order-prompt.properties）
order.consult.prompt=作为电商订单客服助手，用户订单号：${orderNo}，用户问题：${userQuestion}，请按以下规则回复：\n1. 先确认订单号是否有效\n2. 简洁回复问题，不超过3行\n3. 拒绝无关话题

// 2. Prompt工具类（Spring Bean）
@Component
public class PromptTemplateUtil {
    @Autowired
    private ResourceLoader resourceLoader;

    // 缓存Prompt模板，避免重复读取
    private final Map<String, String> promptCache = new ConcurrentHashMap<>();

    // 读取模板并替换参数
    public String getPrompt(String templatePath, Map<String, String> params) throws IOException {
        // 从缓存获取模板，无则加载
        String template = promptCache.computeIfAbsent(templatePath, key -> {
            try {
                Resource resource = resourceLoader.getResource("classpath:" + key);
                return FileUtils.readFileToString(resource.getFile(), StandardCharsets.UTF_8);
            } catch (IOException e) {
                throw new RuntimeException("加载Prompt模板失败：" + key, e);
            }
        });
        // 替换动态参数
        for (Map.Entry<String, String> entry : params.entrySet()) {
            template = template.replace("${" + entry.getKey() + "}", entry.getValue());
        }
        return template;
    }
}

// 3. 业务中调用
@Service
public class OrderService {
    @Autowired
    private PromptTemplateUtil promptTemplateUtil;
    @Autowired
    private OpenAiChatClient openAiChatClient;

    public String handleOrderConsult(String orderNo, String userQuestion) throws IOException {
        // 组装参数
        Map<String, String> params = new HashMap<>();
        params.put("orderNo", orderNo);
        params.put("userQuestion", userQuestion);
        // 获取配置化Prompt
        String prompt = promptTemplateUtil.getPrompt("prompt/order-prompt.properties", params);
        // 调用大模型
        return openAiChatClient.call(prompt);
    }
}

2.3 优势分析

解耦：Prompt与代码分离，非开发人员也可修改模板，无需重启服务；
复用：同一模板可在多个业务场景中复用，减少重复开发；
可监控：可通过配置中心动态调整Prompt，实时优化输出效果。

三、高级能力实现：解锁Prompt工程的企业级特性

基于Spring AI与LangChain4j，可实现Prompt的结构化输出、角色设定持久化、少样本/零样本提示等高级能力，解决企业级开发中的核心痛点。

3.1 结构化输出：JSON/Java对象强绑定

企业级应用中，大模型的输出需被程序解析（如存入数据库、调用其他接口），通过Prompt强制指定JSON格式，并结合框架特性，实现与Java对象的强绑定，避免解析异常。

3.1.1 LangChain4j实现方式

// 1. 定义Java实体类
@Data
public class OrderReply {
    private Boolean orderValid; // 订单是否有效
    private String replyContent; // 回复内容
    private String errorMsg; // 错误信息（订单无效时）
}

// 2. 构建Prompt，强制JSON输出
String prompt = """
        作为电商订单客服助手，用户订单号：${orderNo}，用户问题：${userQuestion}
        请按以下JSON格式输出结果，字段不可缺失、不可新增，值为null时需显式标注：
        {
            "orderValid": Boolean,
            "replyContent": String,
            "errorMsg": String
        }
        说明：1. 订单号格式为10位数字，否则视为无效；2. 无效订单需在errorMsg中说明原因；3. replyContent不超过3行
        """;

// 3. LangChain4j绑定Java对象
JsonOutputParser<OrderReply> parser = JsonOutputParserFactory.jsonOutputParser(OrderReply.class);
String finalPrompt = prompt + "\n" + parser.getFormatInstructions();

// 4. 调用大模型并解析
ChatLanguageModel model = OpenAiChatModel.builder()
        .apiKey("your-api-key")
        .modelName("gpt-3.5-turbo")
        .build();

String response = model.generate(finalPrompt);
OrderReply orderReply = parser.parse(response);

3.1.2 关键技巧

明确JSON字段的类型和约束（如“Boolean类型，不可为字符串”）；
加入格式校验提示（如“字段不可缺失、不可新增”）；
结合框架的解析工具（如LangChain4j的JsonOutputParser），减少手动解析代码。

3.2 角色设定持久化：避免身份漂移

大模型在多轮对话中易出现“身份遗忘”（如从“客服”变成“通用助手”），通过Spring AI与LangChain4j的会话管理能力，将角色设定持久化到会话上下文，确保全程身份一致。

// Spring AI 会话管理示例
@Service
public class ChatService {
    @Autowired
    private ChatClient chatClient;

    // 会话上下文存储（企业级可改用Redis）
    private final Map<String, List<Message>> sessionContext = new ConcurrentHashMap<>();

    public String chat(String userId, String userMessage) {
        // 获取用户会话上下文，无则初始化（注入角色设定）
        List<Message> messages = sessionContext.computeIfAbsent(userId, key -> {
            // 角色设定持久化到会话开头
            Message systemMessage = Message.builder()
                    .role(Role.SYSTEM)
                    .content("你是电商订单专属客服助手，仅处理订单相关问题，拒绝无关话题，回复简洁，不超过3行")
                    .build();
            return new ArrayList<>(Collections.singletonList(systemMessage));
        });

        // 新增用户消息
        messages.add(Message.builder().role(Role.USER).content(userMessage).build());

        // 调用大模型，传入完整上下文
        ChatResponse response = chatClient.chat(ChatRequest.builder().messages(messages).build());
        String assistantReply = response.getResult().getOutput().getContent();

        // 保存助手回复到上下文，用于多轮对话
        messages.add(Message.builder().role(Role.ASSISTANT).content(assistantReply).build());

        return assistantReply;
    }
}

3.3 少样本/零样本提示：降低标注成本

企业级场景中，标注数据稀缺，通过少样本（Few-Shot）、零样本（Zero-Shot）提示，让大模型无需大量标注数据，即可完成复杂任务。

3.3.1 少样本提示实战（订单分类场景）

String prompt = """
        请将用户的订单问题分类为以下3类：物流咨询、退款申请、改地址，仅输出分类结果，无需额外说明。
        示例1：用户问“我的订单什么时候发货？” → 物流咨询
        示例2：用户问“我想退掉这个订单，怎么操作？” → 退款申请
        示例3：用户问“我地址填错了，能修改吗？” → 改地址
        用户问题：${userQuestion}
        """;

3.3.2 零样本提示实战（数据清洗场景）

String prompt = """
        请将以下订单号中的无效数据（非10位数字、包含特殊字符）筛选出来，按JSON格式输出无效订单号列表：
        订单号列表：${orderNoList}
        输出格式：{"invalidOrderNos": ["订单号1", "订单号2"]}
        """;

✨ 互动提示：这些高级技巧能帮你解决企业级落地的核心难题，收藏起来，开发时直接套用，效率翻倍～

四、企业级最佳实践：避坑与优化技巧

Prompt工程的企业级落地，除了核心能力，还需关注版本管理、异常兜底、Token优化、国内大模型适配等细节，避免生产环境踩坑。

4.1 Prompt版本管理：追溯与回滚

核心需求：企业级应用中，Prompt的修改需可追溯，出现问题可快速回滚；
实现方案：
1. 给Prompt模板添加版本号（如order-prompt-v1.properties）；
2. 结合Git进行版本控制，记录每次修改的内容和责任人；
3. 通过配置中心（如Nacos）管理不同环境的Prompt版本（开发、测试、生产）。

4.2 异常兜底：避免大模型输出失控

企业级应用需处理各种异常场景，避免大模型输出不符合规范的内容：

格式异常：若大模型未按指定格式输出（如未返回JSON），通过重试机制，重新发送Prompt，并重申格式要求；
内容异常：若输出包含敏感信息、无关内容，通过关键词过滤，拦截异常结果，并返回预设的兜底回复；
超时异常：设置大模型调用超时时间，超时后返回兜底提示（如“当前服务繁忙，请稍后再试”）。

// 异常兜底示例
public String getModelReply(String prompt) {
    try {
        // 设置超时时间为3秒
        ChatRequest request = ChatRequest.builder()
                .messages(Collections.singletonList(Message.builder().content(prompt).build()))
                .timeout(Duration.ofSeconds(3))
                .build();
        ChatResponse response = chatClient.chat(request);
        String reply = response.getResult().getOutput().getContent();
        // 格式校验（JSON格式）
        if (!isValidJson(reply)) {
            // 重试一次，重申格式要求
            String retryPrompt = prompt + "\n请严格按照指定JSON格式输出，不可修改字段，不可添加额外内容";
            reply = chatClient.chat(ChatRequest.builder().messages(Collections.singletonList(Message.builder().content(retryPrompt).build())).build()).getResult().getOutput().getContent();
        }
        // 敏感信息过滤
        if (containsSensitiveWords(reply)) {
            return "当前内容包含敏感信息，无法展示";
        }
        return reply;
    } catch (TimeoutException e) {
        return "当前服务繁忙，请稍后再试";
    } catch (Exception e) {
        return "系统异常，请联系管理员";
    }
}

// JSON格式校验工具
private boolean isValidJson(String content) {
    try {
        new ObjectMapper().readTree(content);
        return true;
    } catch (Exception e) {
        return false;
    }
}

4.3 Token优化：降低企业级应用成本

Token消耗是企业级大模型应用的核心成本之一，通过以下技巧优化Token使用：

精简Prompt：去除冗余描述，核心指令前置，避免无意义的铺垫；
上下文裁剪：多轮对话中，只保留关键上下文（如最近3轮对话），删除早期无关内容；
少样本优化：少样本示例仅保留核心特征，避免冗长，同时复用示例模板；
模型选择：非核心场景使用轻量模型（如GPT-3.5-turbo），核心场景使用高精度模型（如GPT-4），平衡成本与效果。

4.4 国内大模型适配技巧

国内大模型（如智谱AI、通义千问、文心一言）的Prompt适配性与国外模型略有差异，需注意以下几点：

指令更直接：国内模型对简洁、明确的指令响应更好，避免过于复杂的句式；
格式约定更细致：国内模型对JSON等格式的识别精度略低，需在Prompt中明确格式细节（如“JSON字段用双引号，不可用单引号”）；
角色设定更具体：国内模型的角色漂移概率略高，需在Prompt中反复强调角色身份和边界；
框架适配：Spring AI、LangChain4j均支持国内大模型，只需替换API密钥和模型名称，无需修改Prompt核心逻辑。

五、总结

本文围绕Prompt工程的企业级落地，从核心原则、模板化管理、高级能力实现到最佳实践，结合Spring AI与LangChain4j两大框架，拆解了Java场景下大模型应用开发的关键技巧。核心是从“demo级”的Prompt编写，升级为“企业级”的Prompt工程，实现可配置、可复用、可优化、高可用的大模型应用开发能力。

通过本文的方法，你可以搞定Prompt的配置化管理、结构化输出、异常兜底等企业级需求，同时优化Token消耗、适配国内大模型，真正实现从“能跑通”到“能开发”的进阶。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

应对2026查重新规：论文怎么降低ai率？学长亲测10款AIGC降重工具避坑指南

2048 AI社区

论文降重实操：2026新规下怎么降低ai率？学长亲测10款降AI工具避坑指南

2048 AI社区

LangChain 工作流（Workflows）

将 LLM 应用的核心逻辑（模型调用、工具执行、分支判断、记忆管理、检索增强）抽象为节点（Node）和边（Edge），通过可视化的图结构定义执行流程，支持循环、条件分支、多智能体协作等复杂逻辑。# 定义工作流状态user_input: str # 用户输入（如“查询2025Q4销售额并分析”）quarter: str # 提取的季度参数tool_results: dict # 工具执行结果ana