【LLM】关于transformers模型‘init_empty_weights‘报错

在新版本的transformers中（例如我的版本是4.51.0），init_empty_weights已被移动到accelerate库中，而不是直接通过transformers提供，这是hugging face生态重构模块路径的结果。1.安装accelerate库。

何为xl

503人浏览 · 2025-04-08 16:57:34

何为xl · 2025-04-08 16:57:34 发布

关于transformers模型‘init_empty_weights‘报错

问题：报错

NameError: name ‘init_empty_weights’ is not defined

在新版本的transformers中（例如我的版本是4.51.0），init_empty_weights已被移动到accelerate库中，而不是直接通过transformers提供，这是hugging face生态重构模块路径的结果。

解决方案
1.安装accelerate库
init_empty_weights现在由accelerate库提供，需要先安装这个库：

pip install accelerate

2.修改导入路径

导入路径添加

from accelerate import init_empty_weights  # 新路径

旧写法：

import torch
from transformers import GPTNeoForCausalLM, GPT2Tokenizer

model = GPTNeoForCausalLM.from_pretrained("EleutherAI/gpt-neo-125M")

新写法：

import torch
from accelerate import init_empty_weights
from transformers import GPTNeoForCausalLM, GPT2Tokenizer

model = GPTNeoForCausalLM.from_pretrained("EleutherAI/gpt-neo-125M")

新写法运行成功。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

AI+零信任：下一代数据安全智能体的架构演进

在当今数字化时代，数据安全面临着前所未有的挑战。传统的数据安全防护体系已经难以应对日益复杂多变的安全威胁。AI（人工智能）与零信任理念的结合为数据安全带来了新的思路和解决方案，催生出下一代数据安全智能体。本文将深入探讨AI与零信任结合的架构演进，从核心概念、原理、具体实现，到实际应用场景、面临的挑战和未来发展趋势等方面进行全面分析，旨在帮助开发者和安全从业者深入理解这一新兴领域。

2048 AI社区

探索Nginx：深入理解Nginx基础组件的使用

Nginx的每个进程内部都有一个自己的ngx_cycle。展开代码语言：C自动换行AI代码解释void *tag;*/ };

2048 AI社区

提示工程架构师必看：Agentic AI 的6个未来技术突破点

工具元数据描述：用结构化语言定义工具的功能、输入输出、依赖关系，比如：{"工具名称": "物流API","功能描述": "查询快递的实时状态","输入参数": ["订单号"],"输出参数": ["快递位置", "预计到达时间"],"依赖工具": []规划引导prompt：让Agent理解「如何根据任务目标规划工具链」，比如：“你需要处理用户的问题：{用户问题}。首先，拆解任务目标为多个子任务；然后