华为云ModelArts「大模型部署 & 微调」统一入口:
感觉操作起来有点复杂,而且好像没有
而且没有预先设定好的大模型。需要手动弄

自定义大模型
https://console.huaweicloud.com/modelarts/?region=cn-north-4#/dashboard

oss 存储
https://console.huaweicloud.com/obs/?locale=null&region=cn-north-4#/obs/manager/buckets

  1. ModelArts 大模型平台
    https://console.huaweicloud.com/modelarts/?region=cn-north-4#/modelarts/largemodel

    • 零代码上传 → 在线微调(LoRA/全参)
    • 支持 LLaMA-2/ChatGLM/Qwen/DeepSeek 系列
    • 可选 Ascend 910 / GPU(V100/A100)(需先申请配额)
  2. AI 开发平台(旧版 Notebook)
    https://console.huaweicloud.com/modelarts/?region=cn-north-4#/notebook

    • 传统 Notebook + 多卡训练作业
    • 适合脚本式 POST-pretrain / DeepSpeed
  3. 昇腾 AI 市场(镜像 & 模型库)
    https://www.hiascend.com/zh/software/modelzoo

    • 提供官方已转好的 Ascend 910 权重 & Docker 镜像
    • 一键拉取即可在 ModelArts 启动

快速路径(3 步)

① 注册 → 实名 → 开通 ModelArts
② 左侧「大模型」→「创建微调任务」→ 选底座(DeepSeek/Qwen)
③ 上传数据 → 选卡型 → 启动训练(按量¥0.8-1.2/GPU·h)


一句话

华为云大模型就记住一个地址:
https://console.huaweicloud.com/modelarts/?region=cn-north-4#/modelarts/largemodel
其余 Ascend/GPU 资源都在这个控制台里一键申请。

下面给你一份「从零到上线」的 完整实操路线图——用华为云 ModelArts + OBS 完成 DeepSeek-R1 大模型 POST-pretrain → 部署上线 全流程,零代码按钮版 + 脚本版 都有,照着点即可。


🧭 流程总览(5 大步)

注册 → 授权 → 上传数据 → 训练(POST-pretrain)→ 部署 → 测试


① 注册 + 一次性授权(3 min)

  1. 注册并实名 https://reg.huaweicloud.com
  2. 进入 ModelArts 控制台
    https://console.huaweicloud.com/modelarts/?region=cn-north-4
  3. 首次会弹出 “依赖服务授权” → 全部勾选 → 一键授权
    (OBS、SWR、IAM、TMS、VPC、SFS、EPS、CES、SMN、KMS、LTS)
    ✅ 授权一次永久有效,后续不再提示。

② 创建 OBS 桶(数据 & 模型仓库)

控制台 → 对象存储 OBS → 创建桶

  • 区域:华北-北京四(与 ModelArts 同区)
  • 桶名:deepseek-r1-pt-<你的账号名>
  • 存储类别:标准存储
  • 桶策略:公共读(仅训练时方便下载,用完可改私有)

③ 上传数据(POST-pretrain 语料)

1️⃣ 准备数据
  • 格式:纯文本文件(一行一条 SMILES / 蛋白序列)
  • 编码:UTF-8
  • 示例命名:train.txt val.txt
2️⃣ 上传
  • 控制台 → OBS → 进入桶 → 上传文件(单文件 < 5 GB)
  • obsutil 命令(大文件并行)
# 本地安装 obsutil(一次性)
wget https://obs-community.obs.cn-north-1.myhuaweicloud.com/obsutil/current/obsutil_linux_amd64.tar.gz
tar -zxvf obsutil_linux_amd64.tar.gz && sudo mv obsutil /usr/local/bin/

# 配置 AK/SK(在“我的凭证”里复制)
obsutil config -i=YOUR_AK -k=YOUR_SK -e=obs.cn-north-4.myhuaweicloud.com

# 上传
obsutil cp train.txt obs://deepseek-r1-pt-xxx/data/
obsutil cp val.txt   obs://deepseek-r1-pt-xxx/data/

④ 创建大模型微调任务(POST-pretrain)

控制台 → ModelArts → 大模型 → 创建任务

步骤 推荐值
任务名称 deepseek-r1-32b-pt
区域 华北-北京四
底座模型 DeepSeek-R1-Distill-Qwen-32B(列表里已内置)
训练模式 继续预训练(Post-pretrain)
数据路径 obs://deepseek-r1-pt-xxx/data/train.txt
验证路径 obs://deepseek-r1-pt-xxx/data/val.txt
超参 learning_rate=2e-5, epochs=3, batch_size=1, block_size=2048
高级开关 打开「用户已分词」→ vocab_size=32000, bos=1, eos=2
计算资源 GPU: 1×V100-32G(够用)或 1×A100-40G(更快)
分布式 单卡即可;若要 4×A100 → 选「多机多卡」

→ 下一步 → 立即创建 → 状态变为 运行中(约 2-3 h 完成)

你看到的页面是 ModelArts 第一次使用时的“委托授权”环节——把操作权限交给 ModelArts 服务账号,否则无法访问你的 OBS、SWR 等资源。
5 秒搞定,步骤如下:


✅ 一步创建委托(0 元,无风险)

  1. 单击页面里的 「新增委托」 按钮
    (或提前到 IAM 控制台 → https://console.huaweicloud.com/iam/ → 委托 → 创建委托,再回来选)

  2. 在弹出抽屉填写:

    字段 推荐值
    委托名称 ModelArts-trust(任意英文字母+数字)
    委托类型 云服务
    云服务 ModelArts
    持续时间 永久
    权限集 一键勾选 “ModelArts 常用权限”(含 OBS、SWR、VPC 等只读+操作权限)
  3. 确认 → 创建成功(0 费用,仅授权


✅ 回到授权页

  1. 刷新/重新进入 ModelArts 授权页 → 「委托选择」下拉框里会出现刚才的 ModelArts-trust
  2. 勾选 “我已阅读并同意《ModelArts 服务声明》”
  3. 单击 「授权」 → 页面自动关闭,授权完成!

🔍 常见疑问

疑问 解答
要不要付钱? 完全免费,只是 IAM 授权逻辑
权限会不会过大? 系统预设的 最小够用集(不会读写你其他服务)
以后想收回? IAM → 委托 → 删除即可,即时失效

一句话

点“新增委托”→ 选 ModelArts → 起名+勾权限 → 创建 → 回来选它 → 勾选声明 → 授权,全程 30 秒,无费用。


⑤ 部署上线(一键发布)

训练完成后 → 任务详情 → 版本管理发布

选项
服务名称 deepseek-r1-pt-svc
实例规格 GPU-1×V100-32G
副本数 1(可弹性 1-8)
环境变量 默认即可
白名单 0.0.0.0/0(测试阶段)

确认发布 → 1-2 min 后拿到 HTTPS 调用地址 + Token


⑥ 测试你的服务

curl -X POST https://modelarts.cn-north-4.myhuaweicloud.com/v1/infers/xxx \
  -H "Content-Type: application/json" \
  -H "X-Auth-Token: $TOKEN" \
  -d '{"inputs":"<|startoftext|><P>MKLVL...<L>CCO"}'

返回即模型生成的 SMILES/序列。


⑦ 账单参考(按量)

资源 单价 单卡 3 h 训练 + 24 h 部署
V100-32G 6.5 ¥/h (3+24)×6.5 = 175 ¥
A100-40G 9.2 ¥/h (3+24)×9.2 = **248 ¥」

一句话总结

华为云大模型「POST-pretrain → 部署」一条链路:
授权 → OBS 传数据 → ModelArts 点训练 → 发布服务 → 拿到 HTTPS API
全流程 0 代码,单卡 V100 3 小时 ≈ 200 元内搞定。

“启动文件”就是 ModelArts 替你执行的第一行脚本(entry point),告诉平台:
先跑哪个 .py / .sh 文件,再传什么参数。
它不是系统命令,而是你代码仓库里 你自己写的训练脚本。下面给你 3 分钟现成模板,直接复制即可通过校验。

deepseek-pt
然后 deepseek-pt目录下面的train.py
不用obs://格式了

stdbuf: failed to run command ‘/home/ma-user/modelarts/user-job-dir/deepseek-pt/train.py’: Permission denie

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐