Hugging Face Transformers 入门：加载预训练模型并进行推理

本文介绍了如何使用Hugging Face的Transformers库加载预训练模型进行NLP任务推理。通过简单的pipeline函数，用户可轻松实现情感分析、文本生成和掩码填充等任务，无需关注底层实现细节。文章还推荐了AI对话平台和高性价比API服务，帮助学习者从入门到项目开发过渡。核心要点包括：安装环境配置、pipeline的基本用法示例（情感分析、文本生成和掩码填充），以及进一步学习资源的指

TwoAI

647人浏览 · 2025-09-16 18:07:31

TwoAI · 2025-09-16 18:07:31 发布

Hugging Face Transformers 入门：加载预训练模型并进行推理

在这里插入图片描述

导语

在自然语言处理（NLP）领域，Hugging Face 无疑是当下最火热、最核心的开源社区与工具库。其 Transformers 库提供了数以万计的预训练模型，涵盖文本分类、问答、文本生成等各类任务，极大地降低了先进 NLP 技术的应用门槛。本文将作为入门指南，带你学习 Transformers 库最基础、最核心的功能：如何加载一个预训练模型并用它来进行推理。

一、 Hugging Face 与 Transformers 简介

Hugging Face Hub：一个模型共享平台，你可以把它想象成 NLP 领域的 “GitHub”。研究者和开发者在这里分享他们的模型、数据集和演示。
Transformers 库：一个 Python 库，提供了简单、统一的 API 来下载和使用 Hub 上的预训练模型。

我们的目标是利用这个库，仅用几行代码就调用一个强大的预训练模型完成特定任务。

二、环境准备

首先，你需要安装 Transformers 库。由于它通常与 PyTorch 或 TensorFlow 配合使用，我们也需要安装其中之一。这里以 PyTorch 为例。

# 安装 Transformers 和 PyTorch
pip install transformers torch

✅ 提示：torch 是 PyTorch 的包名。如果你使用的是 GPU，请确保安装了与你的 CUDA 版本匹配的 PyTorch。

三、核心利器：`pipeline` 函数

对于初学者而言，pipeline 是 Transformers 库中最简单、最强大的工具。它将模型推理的复杂步骤（分词、模型调用、后处理）全部封装起来，让你只需关注任务本身。

1. 任务一：情感分析 (Sentiment Analysis)

情感分析是 NLP 的经典任务，用于判断一段文本的情绪（如正面、负面）。

from transformers import pipeline

# 1. 创建一个情感分析的 pipeline
# 第一次运行时，会自动下载并缓存模型
classifier = pipeline('sentiment-analysis')

# 2. 准备文本数据
text1 = "I love how easy it is to use the Transformers library!"
text2 = "I'm not sure about this movie, the plot was a bit boring."

# 3. 进行推理
results = classifier([text1, text2])

# 4. 查看结果
for result in results:
    print(f"Label: {result['label']}, Score: {result['score']:.4f}")

输出将会是：

Label: POSITIVE, Score: 0.9998
Label: NEGATIVE, Score: 0.9995

⚠️ 发生了什么？

pipeline('sentiment-analysis') 会自动从 Hub 下载一个默认的、适合情感分析任务的预训练模型（如 distilbert-base-uncased-finetuned-sst-2-english）。
当你传入文本时，pipeline 会自动处理所有细节，并返回一个清晰、易于理解的结果。

2. 任务二：文本生成 (Text Generation)

文本生成是 AI 最令人惊艳的应用之一。我们可以用 pipeline 快速实现。

from transformers import pipeline

# 1. 创建一个文本生成的 pipeline，并指定模型（例如 GPT-2）
generator = pipeline('text-generation', model='gpt2')

# 2. 提供一个起始文本（prompt）
prompt = "In a world where AI is becoming more powerful, "

# 3. 进行推理
# max_length 控制生成文本的总长度
# num_return_sequences 控制返回几个不同的生成结果
generated_texts = generator(prompt, max_length=50, num_return_sequences=1)

# 4. 查看结果
print(generated_texts[0]['generated_text'])

可能的输出：

In a world where AI is becoming more powerful, the need for a new generation of AI has become more urgent. The new generation of AI will be able to learn from the mistakes of the past and apply them to the future.

3. 任务三：掩码填充 (Fill-Mask)

这个任务常用于语言模型的预训练，即预测句子中被遮盖（mask）的单词。

from transformers import pipeline

# 1. 创建 pipeline
unmasker = pipeline('fill-mask')

# 2. 准备带 [MASK] 标记的文本
text = "The capital of France is [MASK]."

# 3. 推理
results = unmasker(text)

# 4. 查看最有可能的几个填充词
for result in results:
    print(f"Token: {result['token_str']}, Score: {result['score']:.4f}")

输出将会是：

Token: Paris, Score: 0.8723
Token: paris, Score: 0.0958
Token: PARKS, Score: 0.0019
...

四、深入探索：AI 工具与社区资源

当你熟练掌握 pipeline 并希望深入学习时，高效的工具和活跃的社区将是你的加速器。无论是模型选型、代码调试还是 API 集成，善用 AI 工具都能让你事半功倍。

😳 AI 助手与 API 推荐

免费 AI 对话平台 (https://0v0.pro)
- 优点：对于学习者来说，这是一个完美的“沙盒”。你可以免费、无限制地与 Llama、Qwen 等多种模型对话，甚至能体验到 gpt-4o、gpt-5-mini 等先进模型。在探索 Transformers 的不同模型时，可以先通过对话了解其特性。
- 场景：卡壳时，直接把代码问题或模型选择的困惑丢给它，获取即时反馈。
高性价比 API 服务
- 按量计算 (https://llm-all.pro)：当你从学习转向项目开发，需要将 NLP 功能集成到自己的应用中时，这里的 API 提供了极具吸引力的价格。你可以用官方 1 折的成本调用 OpenAI、Claude 等顶级模型，或以 2-6 折使用国内主流模型。
- 按次计算 (https://fackai.chat)：适合个人开发者或小型项目，按次付费，成本控制更灵活。

总结

本文展示了如何使用 Hugging Face Transformers 库中的 pipeline 函数，轻松加载预训练模型并完成情感分析、文本生成和掩码填充等多种 NLP 任务。pipeline 是入门 Transformers 生态的最佳起点，它为你屏蔽了底层的复杂性。

下一步，你可以：

访问 Hugging Face Hub，探索更多有趣的任务和模型。
尝试在 pipeline 中指定不同的模型 ID，看看效果有何不同。
深入学习 Tokenizer 和 Model 类的手动调用方式，以实现更高度的定制化。

希望本文能为你打开通往现代 NLP 世界的大门！

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

60.【.NET8 实战--孢子记账--从单体到微服务--转向微服务】--新增功能--识别图片文字内容

本文介绍了如何通过OCR技术实现图片文字识别功能，并将其集成到系统中。主要内容包括：服务实现：在微服务中新建IOCRService接口和BaiduOCRServiceImpl实现类，通过消息队列处理图片识别请求文字识别流程：验证图片有效性后，将文件信息发送至消息队列 OCR消费者服务：新建OCRConsumerService类，接收队列消息并调用百度OCR API进行文字识别异常处理：对图片

2048 AI社区

【无人机三维路径规划】基于基于NSGAII实现考虑汽车风险、撞击面积、大气密度的复杂楼市内无人机三维路径规划研究（Matlab代码实现）

本研究针对城市高密度建筑群、商业区多层停车场等复杂楼市环境，提出一种基于非支配排序遗传算法（NSGA-II）的无人机三维路径规划方法。该方法综合考虑汽车动态风险、撞击面积、大气密度变化等约束条件，通过多目标优化平衡安全性、经济性与稳定性。实验表明，该算法在复杂场景下可生成帕累托最优解集，路径规划成功率提升32.7%，能耗降低19.4%，满足实际工程需求。

2048 AI社区

提示工程架构师指南：构建企业级AI提示中台

要构建有效的提示中台，首先需要明确企业的核心需求资产化：将Prompt模板、示例、知识库等转化为可管理的资产，支持版本控制、权限管理；编排化：支持多Prompt的组合（如先调用「意图识别」Prompt，再调用「文案生成」Prompt），以及与大模型、业务系统的交互；智能化：支持Prompt的自动生成、优化、适配（如根据用户反馈调整Prompt）；可观测：收集Prompt的调用日志、效果数据（如响应