langchain(五)调用本地大模型实现embedding-BCE 嵌入模型本地部署与调用指南

本文介绍了如何下载和使用maidalun/bce-embedding-base_v1双语嵌入模型的完整流程。首先需要注册魔塔社区并搜索该模型，然后安装modelscope、sentence_transformers等必要依赖。文章提供了两种运行模型的方法：通过LangChain框架调用HuggingFaceEmbeddings，以及直接使用SentenceTransformer进行本地推理。两种方

sadfasdfsafadsa

198人浏览 · 2026-01-03 11:45:23

sadfasdfsafadsa · 2026-01-03 11:45:23 发布

一、模型介绍与应用价值

在 RAG（检索增强生成）、文本相似度计算、语义检索等场景中，文本嵌入模型是核心基础 —— 它能将自然语言转为计算机可理解的向量，实现语义级别的文本处理。

maidalun/bce-embedding-base_v1是魔塔社区（ModelScope）开源的中英双语嵌入模型，具备以下优势：

轻量级：部署门槛低，普通 CPU 即可运行；
跨语种：支持中文、英文及跨语种语义匹配；
适配 RAG：生成的向量归一化后，检索准确率更高；
完全开源：可本地部署，无 API 调用成本和数据隐私风险。

本文将手把手教你完成：

魔塔社区注册与模型下载；
基于 LangChain 框架调用本地 BCE 模型；
不依赖框架，原生调用 BCE 模型；
两种调用方式的对比与适用场景。

二、前期准备：环境与工具安装

2.1 注册魔塔社区账号

访问魔塔社区官网：https://www.modelscope.cn/；
完成账号注册（支持手机号 / 阿里云账号登录）；
搜索模型：在搜索框输入maidalun/bce-embedding-base_v1，进入模型详情页（确认模型用途为 “中英双语 embedding，适配 RAG”）。

2.2 安装核心依赖

打开终端 / 命令行，执行以下命令安装所需库：

# 魔塔社区模型下载工具
pip install modelscope
# HuggingFace模型运行核心库
pip install transformers
# SentenceTransformers（原生调用模型）
pip install sentence-transformers
# LangChain-HuggingFace适配层（框架调用）
pip install -U langchain-huggingface
# 可选：PyTorch（模型运行依赖）
pip install torch

注意：若安装过程中出现版本冲突，建议创建虚拟环境（conda create -n bce_env python=3.10），避免影响全局环境。

三、实操步骤 1：下载 BCE 模型到本地

通过魔塔社区的snapshot_download工具，可一键下载模型到指定目录，无需手动下载解压。

3.1 下载代码实现

from modelscope import snapshot_download

# 模型名称（魔塔社区的模型标识）
model_name = "maidalun/bce-embedding-base_v1"
# 本地下载路径（建议使用绝对路径，避免中文/空格）
cache_dir = "D:\\本地模型"

# 执行下载（首次运行需等待，模型大小约1GB）
model_dir = snapshot_download(
    model_name,
    cache_dir=cache_dir,
    # 可选：指定模型版本，默认最新
    # revision="master"
)

print(f"模型下载完成，路径：{model_dir}")
# 预期输出：D:\本地模型\maidalun\bce-embedding-base_v1

3.2 下载注意事项

网络问题：若下载速度慢，可配置阿里云镜像源；
路径问题：cache_dir建议使用英文路径，避免中文 / 特殊字符导致后续调用失败；
重复下载：模型下载后会缓存到指定目录，再次运行该代码不会重复下载。

四、实操步骤 2：基于 LangChain 调用本地 BCE 模型

LangChain 是大模型应用开发的主流框架，封装了嵌入模型的调用逻辑，适配 RAG、向量库等场景。

4.1 完整代码实现

from langchain_huggingface import HuggingFaceEmbeddings

# 本地模型路径（下载后的实际路径）
model_name = r'D:\本地模型\maidalun\bce-embedding-base_v1'

# 嵌入配置：向量归一化（提升检索/相似度计算精度）
encode_kwargs = {'normalize_embeddings': True}

# 初始化嵌入模型
embeddings = HuggingFaceEmbeddings(
    model_name=model_name,  # 本地模型路径
    encode_kwargs=encode_kwargs,  # 向量归一化
    model_kwargs={'device': 'cpu'}  # 指定运行设备（CPU/GPU）
)

# 测试：对单条文本生成嵌入向量
text = "大模型"
# 方式1：批量文档嵌入（返回二维列表）
text_result = embeddings.embed_documents([text])
print("文档嵌入向量（前5个值）：", text_result[0][:5])

# 方式2：查询语句嵌入（返回一维列表）
query_result = embeddings.embed_query(text)
print("查询嵌入向量（前5个值）：", query_result[:5])

4.2 核心代码解析

HuggingFaceEmbeddings：LangChain 封装的本地嵌入模型调用类，自动适配 SentenceTransformers 格式的模型；
normalize_embeddings=True：对生成的向量做归一化处理，使向量长度为 1，是 RAG 场景的最佳实践；
两种嵌入方法：
- embed_documents：批量处理文档文本（返回[向量1, 向量2,...]），适合构建向量库；
- embed_query：处理单个查询语句（返回一维向量），适合检索时的查询向量化。

4.3 预期输出

文档嵌入向量（前5个值）： [0.01234, -0.05678, 0.09876, -0.04321, 0.07654]
查询嵌入向量（前5个值）： [0.01234, -0.05678, 0.09876, -0.04321, 0.07654]

五、实操步骤 3：原生调用本地 BCE 模型（无框架依赖）

若无需使用 LangChain 框架，可直接通过SentenceTransformers调用模型，更灵活、轻量化。

5.1 完整代码实现

from sentence_transformers import SentenceTransformer

# 本地模型路径
model_path = r'D:\本地模型\maidalun\bce-embedding-base_v1'

# 加载模型（首次加载需初始化，约10秒）
model = SentenceTransformer(model_path)

# 测试文本列表
sentences_1 = ["样例数据-1", "样例数据-2"]

# 生成嵌入向量（归一化）
embeddings = model.encode(
    sentences_1,
    normalize_embeddings=True,  # 与LangChain配置保持一致
    device='cpu'  # 指定运行设备
)

# 输出向量结果（形状：[文本数量, 向量维度]，BCE模型维度为768）
print("嵌入向量形状：", embeddings.shape)
print("嵌入向量详情：")
print(embeddings)

5.2 核心代码解析

SentenceTransformer：专门用于文本嵌入的轻量级库，兼容绝大多数开源嵌入模型；
model.encode()：核心方法，支持批量文本向量化，返回 numpy 数组（更易处理）；
向量维度：BCE 模型生成的向量维度为 768，可通过model.get_sentence_embedding_dimension()查看。

5.3 预期输出

嵌入向量形状： (2, 768)
嵌入向量详情：
[[ 0.02345 -0.06789  ...  0.08765]
 [ 0.01234  0.05678  ... -0.04321]]

六、两种调用方式对比与适用场景

调用方式	优点	缺点	适用场景
LangChain 框架	适配 RAG / 向量库，可直接对接 FAISS 等工具	依赖框架，灵活性稍低	快速搭建 RAG 系统、向量检索场景
原生 SentenceTransformers	轻量化、灵活，可自定义参数	需手动对接向量库 / 检索逻辑	自定义嵌入流程、轻量化应用

新手建议：若目标是搭建 RAG 系统，优先使用 LangChain 方式；若仅需文本向量化（如相似度计算），优先使用原生方式。

七、常见问题与避坑指南

7.1 模型加载失败

原因：路径错误、模型文件缺失、依赖版本不兼容；
解决：
1. 检查模型路径是否为绝对路径，且包含config.json、pytorch_model.bin等核心文件；
2. 升级依赖：pip install -U sentence-transformers transformers；
3. 避免中文路径：将模型路径改为纯英文（如D:\local_models\bce-embedding）。