DL4J框架入门（一）：核心架构解析，计算图与张量概念

摘要： DL4J是专为JVM生态设计的深度学习框架，核心架构围绕计算图(ComputationGraph)和张量(NDArray)展开。其优势在于：1) 原生Java实现，能与现有Java系统无缝集成；2) 支持信创环境；3) 提供内存可控的张量操作。文章详解了如何构建双塔模型的计算图，并演示了从电科金仓(KES)数据库加载多维数组数据转换为INDArray的过程，包括批量数据读取、NULL值处理

虾米的江湖

552人浏览 · 2026-01-22 08:44:16

虾米的江湖 · 2026-01-22 08:44:16 发布

DL4J 框架入门（一）：核心架构解析 —— 计算图与张量概念

——别让“黑盒调用”掩盖了你对模型执行的理解

大家好，我是那个总在 JVM 堆内存里找 OOM 原因、又在训练日志里看梯度消失的老架构。今天不聊数据预处理，也不谈特征工程——我们回到 AI 的执行引擎本身：

当你在 Java 里写 new MultiLayerNetwork(conf)，背后到底发生了什么？

很多人把 DL4J 当成一个“调包工具”：配置几行 YAML，调个 fit()，就以为万事大吉。
但现实是：如果你不懂它的计算图和张量表示，就无法诊断性能瓶颈、无法优化内存、更无法与国产数据库协同构建端到端流水线。

而真相是：DL4J 不是 TensorFlow 的 Java 封装，它是一个为 JVM 生态原生设计的深度学习框架。

今天我们就拆解 DL4J 的核心架构，理解 NDArray（张量） 与 Computation Graph（计算图） 如何协同工作，并展示如何从电科金仓 KingbaseES（KES）高效加载张量数据。

一、为什么要在 Java 里做深度学习？

先回答一个根本问题：既然 Python 有 PyTorch/TensorFlow，为什么还要用 DL4J？

答案不是“情怀”，而是工程现实：

金融、电信、政务等核心系统，90% 是 Java 技术栈；
模型需与现有交易、风控、日志系统同进程部署，避免跨语言 RPC 开销；
信创合规要求：不能依赖境外开源生态的不可控组件。

DL4J 的价值，就在于它让 Java 工程师不用出 JVM，就能构建生产级 AI 能力。

二、核心抽象一：NDArray —— 张量的 JVM 表达

在 DL4J 中，一切数据都是 INDArray（Interface for N-Dimensional Array）。它是 DL4J 对张量（Tensor）的实现，底层由 ND4J 库提供支持（可运行在 CPU 或 GPU 上）。

关键特性：

多维：支持任意维度（1D 向量、2D 矩阵、3D+ 张量）；
类型安全：float（默认）、double；
内存可控：可分配在堆外内存（Off-Heap），避免 GC 压力；
操作向量化：加减乘除、矩阵乘、激活函数等均 C++ 加速。

示例：创建一个 768 维用户 embedding

// 从 KES 读取的 float[] → 转为 INDArray
Float[] dbEmbedding = ...; // 从 KES ResultSet.getObject("embedding") 获取

// 转换为 (1, 768) 的行向量
INDArray userVector = Nd4j.create(
    Arrays.stream(dbEmbedding).mapToDouble(Float::doubleValue).toArray(),
    new long[]{1, 768}  // shape
);

System.out.println("Shape: " + Arrays.toString(userVector.shape())); // [1, 768]
System.out.println("Data type: " + userVector.dataType());          // FLOAT

🔗 驱动请从电科金仓官网下载，确保能正确读取 REAL[] 并转为 Float[]。

三、核心抽象二：ComputationGraph —— 模型即图

DL4J 支持两种模型结构：

MultiLayerNetwork：适用于简单 MLP、CNN；
ComputationGraph：适用于复杂拓扑（如 ResNet、多输入/输出）。

所有模型，在 DL4J 中都被表示为一张有向无环图（DAG）：

节点（Vertex）：层（Layer）或操作（如合并、切片）；
边（Edge）：张量流动方向。

示例：构建一个简单的双塔召回模型

ComputationGraphConfiguration conf = new NeuralNetConfiguration.Builder()
    .seed(123)
    .updater(new Adam(0.001))
    .graphBuilder()
    .addInputs("user_input", "item_input")  // 两个输入

    // 用户塔
    .addLayer("user_dense", 
        new DenseLayer.Builder().nIn(768).nOut(128).build(), 
        "user_input")
    .addLayer("user_output", 
        new OutputLayer.Builder().nIn(128).nOut(64).activation(Activation.TANH).build(), 
        "user_dense")

    // 商品塔
    .addLayer("item_dense", 
        new DenseLayer.Builder().nIn(768).nOut(128).build(), 
        "item_input")
    .addLayer("item_output", 
        new OutputLayer.Builder().nIn(128).nOut(64).activation(Activation.TANH).build(), 
        "item_dense")

    // 输出：点积相似度（简化）
    .setOutputs("user_output", "item_output")
    .build();

ComputationGraph model = new ComputationGraph(conf);
model.init();

✅ 优势：

图结构清晰，易于调试；

支持动态 batch size；

可序列化保存（.zip 文件），便于部署。

四、实战：从 KES 加载张量数据，喂给 DL4J

假设我们在 KES 中有一张表存储用户和商品 embedding：

CREATE TABLE ai_features.user_item_pairs (
    pair_id      VARCHAR(64),
    user_emb     REAL[768],
    item_emb     REAL[768],
    label        INT  -- 0/1 是否点击
);

步骤 1：批量读取并构建 DataSet

public List<DataSet> loadTrainingData(Connection conn, int batchSize) {
    String sql = "SELECT user_emb, item_emb, label FROM ai_features.user_item_pairs";
    List<DataSet> batches = new ArrayList<>();
    
    try (PreparedStatement ps = conn.prepareStatement(sql);
         ResultSet rs = ps.executeQuery()) {

        List<INDArray> userList = new ArrayList<>();
        List<INDArray> itemList = new ArrayList<>();
        List<INDArray> labelList = new ArrayList<>();

        while (rs.next()) {
            // 读取数组
            Float[] userArr = (Float[]) rs.getObject("user_emb");
            Float[] itemArr = (Float[]) rs.getObject("item_emb");
            int label = rs.getInt("label");

            // 转为 INDArray
            userList.add(toINDArray(userArr));
            itemList.add(toINDArray(itemArr));
            labelList.add(Nd4j.scalar(label).reshape(1, 1));

            if (userList.size() == batchSize) {
                // 构建 batch
                INDArray userBatch = Nd4j.vstack(userList.toArray(new INDArray[0]));
                INDArray itemBatch = Nd4j.vstack(itemList.toArray(new INDArray[0]));
                INDArray labelBatch = Nd4j.vstack(labelList.toArray(new INDArray[0]));

                batches.add(new DataSet(
                    new INDArray[]{userBatch, itemBatch},  // 多输入
                    new INDArray[]{labelBatch}
                ));

                // 清空
                userList.clear(); itemList.clear(); labelList.clear();
            }
        }
    }
    return batches;
}

private INDArray toINDArray(Float[] arr) {
    return Nd4j.create(
        Arrays.stream(arr).mapToDouble(f -> f != null ? f : 0.0).toArray(),
        new long[]{1, arr.length}
    );
}

💡 注意：

使用 Nd4j.vstack() 合并样本；

多输入模型需传 INDArray[]；

NULL 安全处理（KES 中可能有缺失值）。

五、与 KES 协同：构建端到端训练流水线

理想的数据流应是：

KES (原始特征) 
  → KES (预处理视图) 
  → Java (批量读取 + NDArray 转换) 
  → DL4J (训练) 
  → KES (保存模型元数据)

例如，训练完成后，将模型版本、指标写回 KES：

INSERT INTO ai_models.model_registry (
    model_name, version, framework, 
    train_data_version, metrics, created_at
) VALUES (
    'user_item_dssm', 'v1', 'DL4J-1.0.0-M2',
    'v20240601', '{"auc": 0.89, "loss": 0.32}', NOW()
);