谁是本地代码模型王者？Qwen3-Coder-30B 模型来了，手把手教你Ollama 一键部署！

本文介绍了将Qwen3-Coder-30B-A3B-Instruct大模型转换为GGUF格式并部署到Ollama的完整流程。主要内容包括：1）直接使用现成转换模型的方法；2）详细转换步骤：安装ModelScope和llama.cpp、下载原始模型、使用llama.cpp转换为GGUF格式（建议q8_0量化）；3）创建Ollama Modelfile配置文件；4）模型创建与测试方法。文章还提供了性能

乔代码嘚

706人浏览 · 2025-08-04 14:59:19

乔代码嘚 · 2025-08-04 14:59:19 发布

之前随手发过使用ollama本地部署qwen3-30b-a3b-thinking_q8 以及 qwen3-30b-a3b-instruct_q8 的简单命令。

有的朋友问是如何将刚发布不久的模型从modelscope或者huggingface转换成ollama上的文件的。

其实思路很简单，就是下载模型，然后用llama.cpp转换成gguf，再用ollama中create命令创建对应模型，然后push推送上去。

本文的步骤零是直接使用现成的

而后面的步骤，则是介绍如何从modelscope下载模型，然后使用 llama.cpp 转换成gguf格式，再用 Ollama 部署 Qwen3-Coder-30B-A3B-Instruct 模型。

环境要求

Python 3.10+
Git
Ollama
足够的磁盘空间（约100GB+，模型本体61G，q8量化后大约30G）

步骤零：直接用转换好的

模型已转换好，直接使用 Ollama 运行即可。

 ollama run hopephoto/qwen3-coder-30b-a3b-instruct_q8

大概需要30G左右的磁盘空间。

步骤一：安装依赖

1.1 安装 ModelScope

 pip install modelscope

1.2 克隆 llama.cpp 仓库

 git clone https://github.com/ggml-org/llama.cpp
 cd llama.cpp

步骤二：下载模型

使用 ModelScope 下载 Qwen3-Coder-30B-A3B-Instruct 模型：

 modelscope download --model Qwen/Qwen3-Coder-30B-A3B-Instruct

模型将下载到：C:\Users\用户名\.cache\modelscope\hub\models\qwen\Qwen3-Coder-30B-A3B-Instruct

步骤三：转换模型格式

将 Hugging Face 格式转换为 GGUF 格式：

 python convert_hf_to_gguf.py "C:\Users\HP\.cache\modelscope\hub\models\qwen\Qwen3-Coder-30B-A3B-Instruct"--outfile models\qwen3-coder-30b-a3b-instruct_q8.gguf --verbose--outtype q8_0

参数说明

--outfile: 输出文件路径
--verbose: 显示详细转换信息
--outtype q8_0: 量化类型，q8_0 提供较好的质量与大小平衡

步骤四：创建 Ollama Modelfile

创建配置文件 Modelfile_qwen3_coder，文件内容如下所示（要注意文件名和路径与前面转换的匹配，比如一定注意都是qwen3-coder-30b-a3b-instruct_q8.gguf 这个文件哈）：

 FROM models/qwen3-coder-30b-a3b-instruct_q8.gguf 
 
 TEMPLATE """<|im_start|>system
 {{ .System }}<|im_end|>
 <|im_start|>user
 {{ .Prompt }}<|im_end|>
 <|im_start|>assistant
 """
 
 PARAMETER stop "<|im_end|>"
 PARAMETER stop "<|im_start|>"
 
 SYSTEM """你是Qwen，由阿里云开发的AI助手。你对用户的问题和请求总是有帮助、准确和诚实的。"""

配置说明

FROM: 指定模型文件路径
TEMPLATE: 定义对话模板，使用 Qwen 特定的格式
PARAMETER stop: 设置停止标记
SYSTEM: 设置系统提示词

步骤五：在 Ollama 中创建模型

 ollama create qwen3-coder-30b-a3b-instruct_q8 -f Modelfile_qwen3_coder

步骤六：验证安装

运行以下命令测试模型：

 ollama run qwen3-coder-30b-a3b-instruct_q8

使用示例

代码生成示例

 ollama run qwen3-coder-30b-a3b-instruct_q8 "请写一个Python函数来计算斐波那契数列"

代码解释示例

 ollama run qwen3-coder-30b-a3b-instruct_q8 "解释这段代码的功能：def quicksort(arr): ..."

性能评估

在 AMD 7950X + 128G DDR5 RAM + 4060 GPU 8GRAM 的配置的笔记本电脑上运行如下命令：

 ollama run hopephoto/qwen3-coder-30b-a3b-instruct_q8 "请写一个Python函数来计算斐波那契数列"--verbose

得到的性能评测结果为：

 total duration:       1m37.1833561s
 load duration:        11.3397894s
 prompt eval count:    53 token(s)
 prompt eval duration: 2.8421457s
 prompt eval rate:     18.65 tokens/s
 eval count:           410 token(s)
 eval duration:        1m23.0009177s
 eval rate:            4.94 tokens/s

故障排除

常见问题

转换失败：确保有足够的磁盘空间和内存
Ollama 创建失败：检查 Modelfile 路径是否正确
运行缓慢：考虑使用更小的量化级别（如 q4_0）

性能优化

GPU 加速：如果有 NVIDIA GPU，确保安装了 CUDA 支持
内存优化：调整 --ctx-size 参数控制上下文长度

文件结构

 llama.cpp/
 ├── models/
 │   └── qwen3-coder-30b-a3b-instruct_q8.gguf
 ├── Modelfile_qwen3_coder
 └── convert_hf_to_gguf.py

如何学习AI大模型？

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习和面试资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】