提示工程的容器编排实战：教你用Rancher管理提示集群

在AI时代，提示工程（Prompt Engineering）已经从“技巧”变成了“基础设施”。企业需要运行大量提示服务：有的是面向内部员工的工具（比如文案助手），有的是面向用户的产品（比如AI写作平台），有的是支撑其他系统的中间层（比如电商推荐的提示生成器）。多实例：需要多个容器副本保证高可用性；动态性：业务高峰时需要快速扩容，低谷时需要缩容节省成本；多样性：不同服务可能依赖不同的模型（闭源/开源

搜索引擎技术

984人浏览 · 2025-08-04 16:07:47

搜索引擎技术 · 2025-08-04 16:07:47 发布

提示工程的容器编排实战：教你用Rancher管理提示集群

一、引言 (Introduction)

钩子 (The Hook)

你是否曾遇到过这样的场景？——为了支持不同业务场景（比如产品描述生成、客户服务问答、代码注释辅助），你部署了10个不同的提示服务（分别调用GPT-4、Claude 3、LLaMA 3等模型），每个服务用Docker容器运行。刚开始一切顺利，但随着业务增长，问题接踵而至：

要扩容某个提示服务，得手动登录每个节点启动容器，效率极低；
某个服务突然崩溃，得逐个检查容器日志，定位问题花了2小时；
新入职的工程师想部署一个新的提示服务，却因为不熟悉Kubernetes yaml语法，折腾了半天还没跑起来；
老板问“这个月提示服务的资源消耗是多少？”，你得登录3个云服务商的控制台，导出数据再汇总……

如果这些痛点你都经历过，那么这篇文章就是为你写的。

定义问题/阐述背景 (The “Why”)

在AI时代，提示工程（Prompt Engineering） 已经从“技巧”变成了“基础设施”。企业需要运行大量提示服务：有的是面向内部员工的工具（比如文案助手），有的是面向用户的产品（比如AI写作平台），有的是支撑其他系统的中间层（比如电商推荐的提示生成器）。这些服务的共同特点是：

多实例：需要多个容器副本保证高可用性；
动态性：业务高峰时需要快速扩容，低谷时需要缩容节省成本；
多样性：不同服务可能依赖不同的模型（闭源/开源）、不同的运行环境（Python 3.10/3.11）；
可观测性：需要监控请求量、延迟、错误率，才能及时优化提示效果。

而传统的“手动管理Docker容器”的方式，显然无法满足这些需求。这时候，容器编排工具（比如Kubernetes）成了必然选择，但Kubernetes的学习曲线陡峭，很多AI工程师并不想花大量时间研究“如何写正确的Deployment yaml”。

这就是Rancher的价值——它是一个企业级Kubernetes管理平台，能把复杂的Kubernetes操作变成“点几下鼠标”的简单任务，让AI工程师专注于提示工程本身，而不是容器管理。

亮明观点/文章目标 (The “What” & “How”)

本文将带你完成一个端到端的提示集群管理实战：从0到1安装Rancher，创建Kubernetes集群，部署一个可扩展的提示服务，再通过Rancher实现集群的监控、扩容、升级。读完本文，你将学会：

用Rancher快速搭建Kubernetes集群（无需记住复杂的kubeadm命令）；
用Rancher部署和管理多个提示服务（支持一键扩容、版本升级）；
用Rancher集成的监控工具（Prometheus+Grafana）查看提示服务的运行状态；
避开提示集群管理中的常见陷阱（比如资源耗尽、Ingress配置错误）。

无论你是AI工程师、运维人员，还是想规模化运行提示服务的创业者，这篇文章都能给你带来实用的指导。

二、基础知识/背景铺垫 (Foundational Concepts)

在开始实战前，我们需要明确几个核心概念，避免后续内容出现理解障碍。

1. 提示工程与提示集群

提示工程：指设计、优化和测试AI提示（Prompt）的过程，目的是让大语言模型（LLM）生成更符合预期的输出。比如，“写一篇关于Rancher的技术博客”是一个简单提示，而“写一篇面向AI工程师的Rancher技术博客，要求包含实战步骤和常见陷阱，语言通俗易懂”则是一个优化后的提示。

提示集群：指运行多个提示服务的容器集群。每个提示服务通常是一个API接口（比如用FastAPI实现），接收用户的提示请求，调用LLM（比如OpenAI API、本地部署的LLaMA 3），返回生成的结果。提示集群的核心需求是：高可用（不宕机）、可扩展（按需增减副本）、可观测（能看到运行状态）。

2. 容器编排与Kubernetes

容器编排：指管理多个容器的生命周期的过程，包括部署、扩容、缩容、负载均衡、故障恢复等。Docker解决了“环境一致性”问题，但多容器的管理需要更高级的工具——这就是容器编排工具的作用。

Kubernetes（简称K8s）：目前最流行的容器编排工具，由Google开发，用于自动化容器化应用的部署、扩展和管理。K8s的核心概念包括：

Pod：最小的部署单元，包含一个或多个容器；
Deployment：管理Pod的副本数，实现滚动升级、回滚；
Service：暴露Pod的网络接口，实现负载均衡；
Ingress：管理外部访问集群内服务的规则（比如用域名访问）。

但K8s的缺点是操作复杂——你需要记住大量的命令（比如kubectl create deployment）和yaml语法（比如Deployment的配置文件），这对非运维人员来说不太友好。

3. Rancher：简化K8s管理的利器

Rancher：是一个开源的企业级Kubernetes管理平台，由SUSE公司开发。它的核心价值是降低K8s的使用门槛，让用户通过图形化界面（GUI）完成K8s的大部分操作，而不需要记住复杂的命令。

Rancher的核心功能包括：

多集群管理：可以管理多个K8s集群（比如阿里云的ACK、腾讯云的TKE、自建的RKE2集群），统一查看所有集群的状态；
应用商店：提供预配置的应用模板（比如Nginx、Redis、Prometheus），一键部署；
监控与告警：集成Prometheus和Grafana，实时监控集群资源使用情况（CPU、内存、磁盘）和应用运行状态（请求量、延迟）；
用户权限管理：支持RBAC（基于角色的访问控制），可以给不同用户分配不同的权限（比如开发人员只能部署应用，运维人员可以管理集群）。

对于提示工程来说，Rancher的这些功能正好解决了我们的痛点：用图形化界面部署提示服务，一键扩容，实时监控运行状态。

三、核心内容/实战演练 (The Core - “How-To”)

接下来进入实战环节。我们将完成以下步骤：

安装Rancher服务器；
创建一个Kubernetes集群（用RKE2，Rancher自己的K8s发行版）；
部署一个提示服务（用FastAPI实现，调用OpenAI API）；
用Rancher管理提示集群（扩容、升级、监控）。

前置条件

在开始之前，你需要准备以下环境：

一台Linux服务器（推荐Ubuntu 22.04，配置：2核4G内存，20G磁盘）；
服务器已安装Docker（参考Docker官方文档）；
一个域名（可选，用于配置Ingress，让外部访问提示服务）；
一个OpenAI API密钥（用于测试提示服务）。

步骤一：安装Rancher服务器

Rancher可以通过Docker快速安装，这是最简单的方式。

1. 拉取Rancher镜像

打开Linux服务器的终端，运行以下命令拉取Rancher的稳定版镜像（当前最新稳定版是v2.8.3）：

docker pull rancher/rancher:v2.8.3

2. 运行Rancher容器

用以下命令运行Rancher容器：

docker run -d --restart=unless-stopped \
  -p 80:80 -p 443:443 \
  --name rancher \
  rancher/rancher:v2.8.3

解释：

-d：后台运行容器；
--restart=unless-stopped：容器退出时自动重启（除非手动停止）；
-p 80:80 -p 443:443：映射容器的80（HTTP）和443（HTTPS）端口到主机；
--name rancher：给容器命名为rancher。

3. 访问Rancher界面

等待1-2分钟，然后在浏览器中输入服务器的IP地址（比如https://192.168.1.100），访问Rancher界面。第一次访问时，会提示你设置管理员密码，按照提示操作即可。

设置完成后，你会看到Rancher的 dashboard，如下所示：
外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传（注：图片来自Rancher官方文档）

步骤二：创建Kubernetes集群

接下来，我们用Rancher创建一个Kubernetes集群。这里选择RKE2（Rancher Kubernetes Engine 2），它是Rancher推出的轻量级K8s发行版，适合自建集群。

1. 进入集群创建页面

在Rancher dashboard中，点击左侧菜单栏的“集群”，然后点击“创建”按钮。

2. 选择集群类型

在“创建集群”页面，选择“自定义”（Custom）类型，然后点击“下一步”。

3. 配置集群基本信息

集群名称：输入集群名称（比如prompt-cluster）；
Kubernetes版本：选择最新的稳定版（比如v1.28.3+rke2r1）；
网络插件：选择Calico（默认，适合大多数场景）；
其他配置保持默认，点击“下一步”。

4. 添加集群节点

RKE2集群需要至少一个控制平面节点（Control Plane）和一个工作节点（Worker）。这里我们用同一台服务器作为控制平面和工作节点（适合测试环境）。

在“节点角色”部分，勾选“控制平面”（Control Plane）、“-etcd”（存储集群数据）、“工作节点”（Worker），然后复制生成的节点注册命令（比如）：

curl -sfL https://get.rke2.io | sh -
systemctl enable rke2-server --now

5. 在服务器上执行节点注册命令

回到Linux服务器的终端，粘贴并执行上述命令。等待命令执行完成（约5-10分钟），然后运行以下命令检查RKE2状态：

systemctl status rke2-server

如果输出“active (running)”，说明RKE2已经成功运行。

6. 完成集群创建

回到Rancher界面，点击“完成”按钮。Rancher会自动检测节点状态，等待约5分钟，集群状态会变成“活跃”（Active）。此时，你已经成功创建了一个Kubernetes集群！

步骤三：部署提示服务

现在，我们需要部署一个提示服务。这个服务用FastAPI实现，提供一个/generate接口，接收用户的提示请求，调用OpenAI API生成结果。

1. 编写提示服务代码

首先，创建一个app目录，然后在目录下创建以下文件：

main.py（FastAPI应用代码）：

from fastapi import FastAPI, HTTPException
from pydantic import BaseModel
import openai
import os

# 初始化FastAPI应用
app = FastAPI(title="Prompt Service", version="1.0")

# 从环境变量获取OpenAI API密钥
openai.api_key = os.getenv("OPENAI_API_KEY")

# 定义请求体模型
class PromptRequest(BaseModel):
    prompt: str
    model: str = "gpt-3.5-turbo"  # 默认使用gpt-3.5-turbo
    max_tokens: int = 100  # 默认生成100个token

# 定义响应体模型
class PromptResponse(BaseModel):
    generated_text: str
    model: str
    prompt_tokens: int
    completion_tokens: int

# 生成提示的接口
@app.post("/generate", response_model=PromptResponse)
async def generate_prompt(request: PromptRequest):
    try:
        # 调用OpenAI API
        response = openai.ChatCompletion.create(
            model=request.model,
            messages=[{"role": "user", "content": request.prompt}],
            max_tokens=request.max_tokens
        )
        # 解析响应
        generated_text = response.choices[0].message.content.strip()
        prompt_tokens = response.usage.prompt_tokens
        completion_tokens = response.usage.completion_tokens
        # 返回结果
        return PromptResponse(
            generated_text=generated_text,
            model=request.model,
            prompt_tokens=prompt_tokens,
            completion_tokens=completion_tokens
        )
    except Exception as e:
        raise HTTPException(status_code=500, detail=str(e))

# 健康检查接口
@app.get("/health")
async def health_check():
    return {"status": "ok"}

requirements.txt（依赖文件）：

fastapi==0.104.1
uvicorn==0.24.0.post1
pydantic==2.5.3
openai==1.6.1

Dockerfile（构建Docker镜像的文件）：

# 使用Python 3.11作为基础镜像
FROM python:3.11-slim-buster

# 设置工作目录
WORKDIR /app

# 复制依赖文件并安装
COPY requirements.txt .
RUN pip install --no-cache-dir -r requirements.txt

# 复制应用代码
COPY main.py .

# 暴露端口（FastAPI默认运行在8000端口）
EXPOSE 8000

# 运行应用（用uvicorn启动FastAPI）
CMD ["uvicorn", "main:app", "--host", "0.0.0.0", "--port", "8000"]

2. 构建并上传Docker镜像

接下来，我们需要把提示服务构建成Docker镜像，并上传到镜像仓库（比如Docker Hub），这样Rancher才能从仓库拉取镜像部署。

登录Docker Hub：
```
docker login -u your-dockerhub-username
```
输入密码后登录成功。
构建镜像：
在app目录下运行以下命令（替换your-dockerhub-username为你的Docker Hub用户名）：
```
docker build -t your-dockerhub-username/prompt-service:v1.0 .
```

上传镜像到Docker Hub：

docker push your-dockerhub-username/prompt-service:v1.0

3. 用Rancher部署提示服务

现在，回到Rancher界面，我们用应用商店（App Store）部署提示服务。

（1）创建命名空间（Namespace）

命名空间用于隔离集群中的资源（比如不同环境的服务）。我们创建一个prompt-services命名空间：

在Rancher dashboard中，点击左侧菜单栏的“项目/命名空间”；
选择我们创建的prompt-cluster集群；
点击“创建命名空间”，输入名称prompt-services，点击“创建”。

（2）部署应用

在Rancher dashboard中，点击左侧菜单栏的“应用”；
选择prompt-cluster集群和prompt-services命名空间；
点击“创建”按钮，选择“从应用商店”；
在应用商店中搜索“Deployment”（或者直接选择“Deployment”模板）；
填写应用配置：
- 应用名称：输入prompt-service；
- 镜像：输入你上传的Docker镜像地址（比如your-dockerhub-username/prompt-service:v1.0）；
- 端口映射：添加一个端口映射，容器端口填8000，服务端口填8000（用于集群内部访问）；
- 环境变量：添加一个环境变量OPENAI_API_KEY，值为你的OpenAI API密钥；
- 副本数：填2（初始部署2个副本，保证高可用性）；
点击“创建”按钮，等待应用部署完成。

（3）验证应用是否运行正常

部署完成后，点击“应用”列表中的prompt-service，进入应用详情页面：

查看“Pod”状态：如果两个Pod的状态都是“Running”，说明应用运行正常；
查看“日志”：点击某个Pod的“日志”按钮，确认没有错误信息；
测试接口：在集群内部，用curl命令测试/health接口（替换pod-ip为Pod的IP地址）：
```
curl http://pod-ip:8000/health
```
如果返回{"status": "ok"}，说明接口正常。

步骤四：管理提示集群（扩容、升级、监控）

现在，我们的提示服务已经部署到集群中了。接下来，我们用Rancher完成一些常见的管理操作。

1. 扩容提示服务（增加副本数）

当业务高峰来临时，我们需要增加提示服务的副本数，以处理更多的请求。

在Rancher dashboard中，进入prompt-service应用的详情页面；
点击“编辑”按钮；
在“副本数”输入框中，把2改成4；
点击“保存”按钮，等待集群自动扩容。

扩容完成后，你会看到“Pod”列表中新增了2个Pod，状态为“Running”。此时，提示服务的处理能力提升了一倍！

2. 升级提示服务（更新镜像版本）

当我们修改了提示服务的代码（比如优化了提示逻辑），需要升级服务到新版本。

首先，修改main.py中的代码（比如把/generate接口的默认模型改成gpt-4）；
重新构建并上传新版本的Docker镜像（比如your-dockerhub-username/prompt-service:v1.1）；
在Rancher dashboard中，进入prompt-service应用的详情页面；
点击“编辑”按钮；
在“镜像”输入框中，把v1.0改成v1.1；
点击“保存”按钮，等待集群自动升级。

Rancher会采用滚动升级的方式：先启动新版本的Pod，再停止旧版本的Pod，确保升级过程中服务不中断。升级完成后，你会看到所有Pod的镜像版本都变成了v1.1。

3. 配置外部访问（Ingress）

默认情况下，提示服务只能在集群内部访问。如果我们想让外部用户通过域名访问，需要配置Ingress。

假设你有一个域名prompt.example.com，指向Rancher服务器的IP地址，那么可以按照以下步骤配置Ingress：

在Rancher dashboard中，点击左侧菜单栏的“服务发现”→“Ingress”；
选择prompt-cluster集群和prompt-services命名空间；
点击“创建”按钮；
填写Ingress配置：
- 名称：输入prompt-ingress；
- 主机名：输入prompt.example.com；
- 路径：添加一个路径，路径填/，服务选择prompt-service，端口选择8000；
点击“创建”按钮，等待Ingress配置生效。

配置完成后，你可以在浏览器中输入https://prompt.example.com/generate（需要配置HTTPS证书，比如用Let’s Encrypt），测试外部访问是否正常。

4. 监控提示服务（Prometheus+Grafana）

Rancher集成了Prometheus和Grafana，用于监控集群资源和应用运行状态。

在Rancher dashboard中，点击左侧菜单栏的“监控”；
选择prompt-cluster集群；
你可以看到集群的资源使用情况（CPU、内存、磁盘），以及每个应用的运行状态（请求量、延迟、错误率）；
点击“Grafana”按钮，进入Grafana界面（默认用户名admin，密码admin）；
在Grafana中，你可以查看预定义的仪表盘（比如“Kubernetes Pods”），或者创建自定义仪表盘（比如监控/generate接口的请求量）。

四、进阶探讨/最佳实践 (Advanced Topics / Best Practices)

1. 常见陷阱与避坑指南

（1）陷阱一：未设置资源限制，导致集群资源耗尽

如果提示服务的Pod没有设置CPU和内存限制，当服务流量突然增大时，Pod可能会占用大量资源，导致其他服务无法运行。

避坑指南：在部署应用时，设置资源请求（Request）和限制（Limit）。比如，在Rancher的应用配置中，添加以下资源限制：

CPU请求：100m（0.1核）；
CPU限制：500m（0.5核）；
内存请求：256Mi（256MB）；
内存限制：512Mi（512MB）。

这样，Kubernetes会根据资源请求分配节点，并在Pod超过资源限制时终止它（避免影响其他服务）。

（2）陷阱二：Ingress配置错误，导致外部无法访问

Ingress的配置需要注意以下几点：

主机名（Host）必须正确指向Rancher服务器的IP地址；
路径（Path）必须正确映射到服务的端口；
如果使用HTTPS，需要配置证书（比如用Let’s Encrypt）。

避坑指南：在配置Ingress后，用curl命令测试外部访问：

curl -v https://prompt.example.com/health

如果返回200 OK，说明Ingress配置正确；如果返回404 Not Found，说明路径映射错误；如果返回503 Service Unavailable，说明服务没有运行。

（3）陷阱三：未备份Rancher配置，导致数据丢失

Rancher的配置（比如集群信息、应用部署记录）存储在rancher容器的卷中。如果容器被删除，配置会丢失。

避坑指南：定期备份Rancher的配置。可以用以下命令导出Rancher的数据库：

docker exec -t rancher pg_dumpall -c -U rancher > rancher-backup.sql

然后把rancher-backup.sql文件复制到安全的地方（比如云存储）。

2. 性能优化技巧

（1）用缓存减少模型调用次数

提示服务的瓶颈通常是模型调用（比如OpenAI API的延迟）。可以用Redis缓存常用提示的响应，减少模型调用次数。

例如，在main.py中添加Redis缓存：

import redis
from fastapi import FastAPI, HTTPException
from pydantic import BaseModel
import openai
import os
import hashlib

# 初始化Redis客户端
redis_client = redis.Redis(host=os.getenv("REDIS_HOST"), port=os.getenv("REDIS_PORT"), db=0)

# 生成缓存键的函数
def generate_cache_key(prompt: str, model: str, max_tokens: int) -> str:
    key = f"prompt:{prompt}:{model}:{max_tokens}"
    return hashlib.md5(key.encode()).hexdigest()

# 生成提示的接口（添加缓存）
@app.post("/generate", response_model=PromptResponse)
async def generate_prompt(request: PromptRequest):
    # 生成缓存键
    cache_key = generate_cache_key(request.prompt, request.model, request.max_tokens)
    # 从缓存中获取结果
    cached_result = redis_client.get(cache_key)
    if cached_result:
        return PromptResponse.model_validate_json(cached_result)
    # 调用OpenAI API（省略部分代码）
    # 存储结果到缓存（过期时间1小时）
    redis_client.setex(cache_key, 3600, response.json())
    return response

（2）用水平扩容应对流量高峰

Rancher支持水平 pod 自动扩缩（HPA），可以根据CPU使用率或自定义指标（比如请求量）自动调整副本数。

例如，配置HPA让副本数在CPU使用率超过70%时自动扩容：

在Rancher dashboard中，进入prompt-service应用的详情页面；
点击“编辑”按钮；
找到“水平扩缩”部分，开启“自动扩缩”；
设置“最小副本数”为2，“最大副本数”为10；
设置“CPU使用率阈值”为70%；
点击“保存”按钮。

这样，当提示服务的CPU使用率超过70%时，Rancher会自动增加副本数，直到达到最大副本数10。

3. 成本考量

如果你的Kubernetes集群运行在云服务商（比如阿里云、AWS）上，成本是一个重要的考虑因素。以下是一些降低成本的技巧：

选择合适的节点规格：根据提示服务的资源需求，选择合适的节点规格（比如2核4G内存的节点，适合运行多个提示服务副本）；
使用spot实例：云服务商的spot实例（比如阿里云的抢占式实例）价格比按需实例低很多（通常低50%-70%），适合运行无状态的提示服务；
定时缩容：如果提示服务的流量有明显的低谷（比如晚上10点到早上6点），可以用Rancher的定时任务（CronJob）自动缩容副本数，减少资源消耗。

4. 最佳实践总结

用命名空间隔离资源：比如用dev命名空间运行开发环境的提示服务，用prod命名空间运行生产环境的提示服务；
用版本控制管理配置：把Rancher的应用配置（比如Deployment的yaml文件）存储在Git仓库中，便于回滚和协作；
定期更新Rancher和K8s版本：保持Rancher和K8s的版本最新，获取最新的功能和安全补丁；
实现可观测性：用Rancher集成的Prometheus和Grafana监控提示服务的运行状态，及时发现和解决问题。

五、结论 (Conclusion)

核心要点回顾

本文我们学习了如何用Rancher管理提示集群，核心步骤包括：

安装Rancher服务器，快速搭建Kubernetes集群；
部署提示服务（用FastAPI实现，调用OpenAI API）；
用Rancher完成集群管理操作（扩容、升级、监控）；
避开常见陷阱（资源限制、Ingress配置错误），掌握性能优化和成本控制技巧。

展望未来/延伸思考

随着提示工程的规模化应用，提示集群的管理需求会越来越复杂。未来，我们可能会看到以下趋势：

AI自动优化集群：用AI模型预测提示服务的流量，自动调整副本数和资源配置；
多模型提示集群：支持同时运行多个模型（闭源/开源）的提示服务，实现模型的负载均衡和故障转移；
Serverless提示服务：结合Serverless技术（比如AWS Lambda、阿里云函数计算），实现提示服务的按需运行，进一步降低成本。

行动号召

现在，你已经掌握了用Rancher管理提示集群的方法。接下来，我建议你：

亲手尝试本文的实战步骤，部署一个属于自己的提示集群；
在评论区分享你的经验（比如遇到的问题、解决方法）；
学习更多Rancher的高级功能（比如多集群管理、用户权限管理）；
关注提示工程的最新趋势（比如Prompt Tuning、 Retrieval-Augmented Generation），把它们融入到你的提示集群中。

如果你在实践过程中遇到问题，可以参考以下资源：

Rancher官方文档：https://rancher.com/docs/；
FastAPI官方文档：https://fastapi.tiangolo.com/；
OpenAI API文档：https://platform.openai.com/docs/。

最后，祝你在提示工程的道路上越走越远！如果你觉得本文对你有帮助，欢迎点赞、转发，让更多的人看到。

评论区见！ 😊

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

AI原生应用语音合成：重塑语音导航体验

本文旨在解答：为什么传统导航语音总让人“出戏”？AI原生语音合成技术（如神经TTS、多模态TTS）是如何解决这些问题的？我们将覆盖技术原理、核心算法、实战案例，以及未来导航语音的想象空间。本文将从“传统导航语音的痛点”切入，用“讲故事+打比方”的方式解释AI原生语音合成的核心技术（如神经TTS），再通过代码实战演示如何生成个性化导航语音，最后展望未来“有温度的导航语音”可能是什么样。传统TTS：拼

2048 AI社区

Day 15：【99天精通Python】面向对象编程(OOP)中篇 - 封装、继承与多态

本文介绍了Python面向对象编程的三大核心特性：封装、继承和多态。在封装部分，讲解了如何通过私有属性(__前缀)保护数据安全，并提供公共方法访问。继承部分展示了子类如何复用父类代码，包括方法重写和super()函数的使用。多态则通过不同子类实现相同方法产生不同行为，并介绍了Python特有的鸭子类型概念。文章通过工资管理系统实例演示了继承与多态的实际应用，最后用Mermaid图表直观展示类继承关

2048 AI社区

Java 后端如何高效对接 Python 微调大模型？四种数据交互方案全解析（含实战代码）

Python 微调大模型可通过 Flask/FastAPI 暴露 REST 接口，Java 使用 Spring 的或调用。Python 示例（FastAPI）：https://www.zhihu.com/zvideo/1993874870761722160/https://www.zhihu.com/zvideo/1993874870648451336/https://www.zhihu.com/