AI 部署成长：将 TensorFlow 模型部署为 API 服务的 4 个步骤（附 Flask 代码）

将 TensorFlow 模型部署为 Flask API 服务，核心是 “模型加载→接口封装→测试验证→优化落地” 的闭环。通过本文的 4 个步骤，您可快速实现模型的初步部署；若需应对高并发、高安全需求，可进一步集成 Gunicorn、Nginx、API 网关等工具。建议您从简单模型（如本文的预训练模型）开始实操，熟悉流程后再替换为自定义模型 —— 过程中遇到问题可查看 Flask 和 Tenso

2501_93877215

1027人浏览 · 2025-10-30 13:30:17

2501_93877215 · 2025-10-30 13:30:17 发布

在 AI 项目落地过程中，训练好的 TensorFlow 模型仅停留在本地环境是不够的 —— 只有将其封装成可跨平台调用的 API 服务，才能真正对接业务系统、供前端应用或其他服务调用。本文将以实操为核心，通过 4 个清晰步骤，带您完成从 TensorFlow 模型到 Flask API 服务的部署，每一步均配套可直接运行的代码，帮助您快速实现模型落地。

一、准备工作：环境搭建与模型就绪

部署前需完成两项基础准备：搭建依赖环境、确认模型可用。这一步是后续操作的前提，直接影响部署流程的顺畅度。

1. 搭建 Python 依赖环境

需安装 TensorFlow（加载模型）、Flask（构建 API）、numpy（数据处理）等核心库，可通过 pip 一键安装：

bash

pip install tensorflow flask numpy pillow  # pillow用于处理图像类模型的输入

2. 准备 TensorFlow 模型

确保您已拥有训练完成的 TensorFlow 模型，格式可为 SavedModel（官方推荐）或.h5。若暂无自定义模型，可先用 TensorFlow 预训练模型测试，例如图像分类的 MobileNetV2：

python

运行

# 下载并保存预训练模型（首次运行需联网）
import tensorflow as tf
model = tf.keras.applications.MobileNetV2(weights="imagenet", include_top=True)
model.save("mobilenetv2_model")  # 模型保存到当前目录的mobilenetv2_model文件夹

执行后，当前目录会生成 mobilenetv2_model 文件夹，包含模型结构与权重，后续将基于此模型构建 API。

二、核心步骤：用 Flask 构建 API 服务

Flask 是轻量级 Python Web 框架，适合快速搭建 API 服务。本步骤将分模块编写代码，实现 “加载模型→接收请求→执行预测→返回结果” 的完整流程。

1. 编写 Flask API 完整代码

在当前目录新建 model_api.py 文件，复制以下代码（关键步骤已加注释）：

python

运行

# 1. 导入依赖库
from flask import Flask, request, jsonify
import tensorflow as tf
import numpy as np
from PIL import Image  # 处理图像输入（若为非图像模型，可删除此依赖）

# 2. 初始化 Flask 应用
app = Flask(__name__)

# 3. 加载 TensorFlow 模型（服务启动时仅加载一次，避免重复加载耗时）
model = tf.keras.models.load_model("mobilenetv2_model")  # 替换为您的模型路径
# 加载 ImageNet 类别标签（用于图像分类模型返回可读结果，非通用代码）
with open("imagenet_classes.txt", "r") as f:
    class_names = [line.strip() for line in f]

# 4. 定义数据预处理函数（需与模型训练时的预处理逻辑一致）
def preprocess_image(image):
    # 调整图像尺寸（MobileNetV2要求输入尺寸为224x224）
    image = image.resize((224, 224))
    # 转换为numpy数组并归一化（MobileNetV2训练时用此预处理）
    image_array = tf.keras.preprocessing.image.img_to_array(image)
    image_array = np.expand_dims(image_array, axis=0)  # 增加批次维度（模型要求输入为(batch, h, w, c)）
    return tf.keras.applications.mobilenet_v2.preprocess_input(image_array)

# 5. 定义 API 接口（POST方法适合传递图像、JSON等复杂数据）
@app.route("/predict", methods=["POST"])
def predict():
    # 接收请求中的图像文件（若为非图像模型，可改为接收JSON数据）
    if "image" not in request.files:
        return jsonify({"error": "未上传图像文件"}), 400  # 返回错误状态码与提示
    
    # 读取并处理图像
    image_file = request.files["image"]
    image = Image.open(image_file)
    preprocessed_image = preprocess_image(image)
    
    # 执行模型预测
    predictions = model.predict(preprocessed_image)
    # 提取预测概率最高的类别（图像分类场景）
    top_pred_index = np.argmax(predictions[0])
    top_pred_class = class_names[top_pred_index]
    top_pred_prob = float(predictions[0][top_pred_index])  # 转换为Python原生类型（JSON序列化需）
    
    # 返回预测结果（JSON格式）
    return jsonify({
        "predicted_class": top_pred_class,
        "confidence": round(top_pred_prob, 4)  # 保留4位小数，提升可读性
    })

# 6. 启动服务（仅在直接运行该脚本时执行）
if __name__ == "__main__":
    # debug=True 仅用于开发环境（自动重启、显示错误），生产环境需关闭
    app.run(host="0.0.0.0", port=5000, debug=True)

2. 补充 ImageNet 类别标签文件

若使用上述 MobileNetV2 预训练模型，需在同一目录新建 imagenet_classes.txt 文件，存放 1000 个 ImageNet 类别名称（用于将模型输出的数字索引转换为可读标签）。可从 TensorFlow 官方示例复制完整类别列表，避免手动编写出错。

三、测试 API 服务：验证功能可用性

API 服务启动后，需通过请求测试其是否能正常返回预测结果。以下提供两种常用测试方式，适合不同技术背景的使用者。

1. 方式一：用 Postman 可视化测试

Postman 是常用的 API 测试工具，操作步骤如下：

启动 API 服务：运行 python model_api.py，终端显示 “Running on http://0.0.0.0:5000” 即表示启动成功。
打开 Postman，新建请求：
- 选择请求方法为 POST，输入 URL：http://localhost:5000/predict（本地测试）或 http://[服务器IP]:5000/predict（远程测试）。
- 切换到 “Body” 标签，选择 “form-data”，Key 输入 “image”，Value 选择 “File” 并上传一张测试图片（如猫、狗的图片）。
点击 “Send” 发送请求，若返回类似以下 JSON 结果，说明服务正常：

json

{
    "predicted_class": "Egyptian cat",
    "confidence": 0.9876
}

2. 方式二：用 Python 脚本批量测试

若需批量测试或集成到其他 Python 项目，可编写测试脚本 test_api.py：

python

运行

import requests

# 测试图片路径（替换为您的图片路径）
image_path = "test_cat.jpg"
# API 服务地址
api_url = "http://localhost:5000/predict"

# 构造请求（表单形式传递文件）
files = {"image": open(image_path, "rb")}
response = requests.post(api_url, files=files)

# 打印响应结果
if response.status_code == 200:
    print("预测结果：", response.json())
else:
    print("测试失败：", response.json())

运行 python test_api.py，终端将直接输出预测结果，适合快速验证。

四、部署优化与注意事项

开发环境的测试通过后，若要将服务用于生产场景，需注意以下优化点与风险防控，确保服务稳定、安全。

1. 性能优化：替换 Flask 自带服务器

Flask 自带的服务器仅适合开发环境，并发能力弱、稳定性差。生产环境建议使用 Gunicorn（Python WSGI 服务器），搭配 Nginx 反向代理，步骤如下：

安装 Gunicorn：pip install gunicorn。
用 Gunicorn 启动服务：gunicorn -w 4 -b 0.0.0.0:5000 model_api:app。
- -w 4：启动 4 个工作进程（建议设置为 CPU 核心数的 2-4 倍）。
- -b 0.0.0.0:5000：绑定地址与端口，同 Flask 配置。

2. 安全防护：避免未授权访问

默认的 API 接口无访问控制，任何人知道地址即可调用。可通过以下方式简单防护：

添加 API 密钥验证：在请求头中要求传递 X-API-Key，在 Flask 接口中校验：

python

运行

@app.route("/predict", methods=["POST"])
def predict():
    # 校验 API 密钥
    api_key = request.headers.get("X-API-Key")
    if api_key != "your_secure_key_123":  # 替换为您的密钥
        return jsonify({"error": "未授权访问"}), 401
    # 后续预测逻辑不变...