Ascend CANN 8.2.RC1 安装排障小结

日期: 2025-08-06


1. 背景

在 aarch64 服务器上全新安装 Ascend CANN 8.2.RC1(包括 Driver、Toolkit、NNAL-atb/SIP)时,多次遇到
Check owner failed, please check env ASCEND_TOOLKIT_HOME or ASCEND_NNAE_HOME is set.
导致安装中断。本文记录完整排障过程与最终解决方案,供后续参考。


2. 安装顺序与版本

组件 安装包 安装路径 说明
Driver Ascend-cann-driver_8.2.RC1_linux-aarch64.run /usr/local/Ascend/driver 固件 & 内核驱动
Toolkit Ascend-cann-toolkit_8.2.RC1_linux-aarch64.run /usr/local/Ascend/ascend-toolkit 编译器、开发库
NNAL Ascend-cann-nnal_8.2.RC1_linux-aarch64.run /usr/local/Ascend/nnal 大模型推理加速库(含 atb + SIP)

3. 关键报错复现

[ERROR] Check owner failed, please check env ASCEND_TOOLKIT_HOME or ASCEND_NNAE_HOME is set.

4. 根因分析

现象 原因
变量已 export 仍报错 安装器在 子进程 中校验目录 owner ≠ UID/GID,而非变量缺失
Toolkit 目录 owner=xtjc,但用 root 安装 NNAL owner 不一致 触发保护逻辑

5. 排障步骤

graph TD
    A[开始] --> B{Driver已安装?}
    B -->|是| C[安装 Toolkit]
    C --> D{Toolkit 安装失败?}
    D -->|是| E[手动 rm -rf 残留目录]
    E --> C
    D -->|否| F[source Toolkit set_env.sh]
    F --> G[安装 NNAL]
    G --> H{报错“owner failed”?}
    H -->|是| I[chown -R root:root /usr/local/Ascend]
    I --> G
    H -->|否| J[成功]

6. 最终正确操作流程

# 1. 安装 Toolkit
./Ascend-cann-toolkit_8.2.RC1_linux-aarch64.run \
  --install --install-path=/usr/local/Ascend

# 2. 调整 owner(统一 root)
chown -R root:root /usr/local/Ascend

# 3. 加载 Toolkit 环境变量
source /usr/local/Ascend/ascend-toolkit/set_env.sh

# 4. 安装 NNAL
./Ascend-cann-nnal_8.2.RC1_linux-aarch64.run \
  --install --install-path=/usr/local/Ascend/nnal \
  --install-for-all --quiet --nox11

7. 环境变量设置脚本

场景 需加载的脚本
开发/训练 source /usr/local/Ascend/ascend-toolkit/set_env.sh
大模型推理(atb) source /usr/local/Ascend/nnal/nnal/atb/set_env.sh
嵌入式推理(asdsip) source /usr/local/Ascend/nnal/nnal/asdsip/set_env.sh

⚠️ atb 与 asdsip 环境变量只能二选一,同时加载会导致运行异常。


8. 经验总结

  1. 安装顺序:Driver → Toolkit → NNAL,缺一不可。
  2. owner 一致:使用同一用户(root 或普通用户)完成所有 CANN 组件安装;若切换用户,需 chown 保持 UID/GID 一致。
  3. 环境变量:每装完一个组件立即 source 对应 set_env.sh,并在 root/用户 .bashrc 中持久化。
  4. 日志定位:安装失败时优先查看 /var/log/ascend_seclog/ 内对应子日志,关键词 ownerpermissionset_env 快速定位。

9. 参考资料


—— 完结 ——

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐