在本地windows电脑通过Ollama部署Deepseek，qwen和gpt等大模型

摘要：本文介绍了在Windows电脑上使用Ollama部署大模型的完整流程。主要内容包括Ollama的下载安装、模型存储路径修改、模型下载（以Deepseek R1为例）以及两种测试方式（应用界面测试和API接口测试）。文章详细说明了安装过程中的关键步骤和注意事项，并展示了使用Apifox调用Ollama API的示例。通过这种方式，用户可以在本地无需GPU的情况下运行大模型（建议选择30B以下规

天河归来

967人浏览 · 2025-11-18 11:29:00

天河归来 · 2025-11-18 11:29:00 发布

在本地windows电脑通过Ollama部署Deepseek，qwen和gpt等大模型

1. 整体描述
2. 部署步骤
3 总结

1. 整体描述

想在本地部署一个大模型，使用Ollama，Ollama是一个开源工具，主要用于本地化部署和运行大型语言模型（LLM），支持模型量化、微调及RAG应用等操作。并且Ollama可以使用CPU跑各个大模型，不需要GPU就可以在本地电脑运行。
当然肯定是和电脑配置有关。我的电脑的配置是：
联想小新pro14 GT
CPU：Intel Core Ultra 9 285H
显卡：Intel Arc 140T GPU
内存：32G
网上有很多Core Ultra 9 285H部署大模型的测试，说是能跑20B模型，等部署完可以看下能跑到什么程度。

2. 部署步骤

2.1 下载Ollama

Ollama官网：Ollama
点击Download，选择自己的电脑版本相应的Ollama安装包。

2.2 安装Ollama

这里由于Ollama默认安装到C盘，修改安装路径。
以管理员身份打开 PowerShell 或命令提示符（CMD）。这很重要，否则可能因权限不足导致安装失败。切换到你想要安装的目录，比如D:\Ollama，执行：

.\OllamaSetup.exe /DIR="D:\ollama"

命令执行后，会弹出图形化的安装界面，点击 “Install” 即可开始安装。

2.3 修改模型储存路径（推荐）

方法一：使用命令行修改

在管理员身份运行的 PowerShell 或 CMD 中，输入以下命令（注意变量值是你想存放模型的具体路径）：

setx OLLAMA_MODELS "D:\ollama\models"

或者在Windows的环境变量窗口修改。

方法二：通过图形界面设置

打开Ollama程序，在Settings选项卡，也有Model Location的设置，可以在这里修改。

2.4 验证

在命令行输入：

ollama -v

正常出现版本号，就说明安装成功了。
ollama版本号

2.4 下载模型

安装之后就可以在Ollama下载模型了，Ollama的模型仓库提供了基本我们需要的所有模型。模型仓库的地址：Ollama模型仓库
比如下载Deepseek R1模型：

这里面有很多个，不同参数量的模型，个人电脑根据电脑的配置不同，可以选择不同参数的模型，建议个人电脑选择30b以下的模型进行部署。
这里我们下载一个1.5b的模型验证一下，点击1.5b模型，在下面复制命令：
deepseek 1.5b
然后在命令行直接执行，Ollama就会自动下载这个模型，等待下载完成即可。
下载之后，执行：

ollama list

可以查询当前电脑安装的模型列表。

2.5 模型测试

下载完成之后，可以测试下这个模型，有两种测试方式

Ollama应用测试

可以在Ollama聊天页面，选择下载的模型直接提问：
Ollama页面

Ollama接口测试

接口测试，我们需要先在Ollama应用里面，把这个选项打开：
Ollama设置
然后就可以使用接口调试工具进行测试了，我这用Apifox调用一下：
Ollama默认的接口地址是11434，直接调用即可：
调用地址：

http://localhost:11434/api/chat

请求Body：

{
    "model": "deepseek-r1:1.5b",
    "messages": [
        {
            "role": "user",
            "content": "你好，请介绍一下你自己"
        }
    ],
    "stream": false
}

{
    "model": "deepseek-r1:1.5b",
    "created_at": "2025-11-18T03:24:08.1200021Z",
    "message": {
        "role": "assistant",
        "content": "您好！我是由中国的深度求索（DeepSeek）公司开发的智能助手DeepSeek-R1。如您有任何任何问题，我会尽我所能为您提供帮助。"
    },
    "done": true,
    "done_reason": "stop",
    "total_duration": 2772747600,
    "load_duration": 1945882200,
    "prompt_eval_count": 7,
    "prompt_eval_duration": 50844500,
    "eval_count": 40,
    "eval_duration": 714565300
}

调用示例

3 总结

这里就简单讲下，Ollama安装和调用模型相关，当然，也可以下载其他模型测试下，然后后面可以把自己本地的模型接入Dify，这样就不用为调用Token收费而烦恼了，但是本地模型能力有限，自己抉择吧。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

AI学习笔记整理（51）——大模型之RAG优化技术

那么这样的嵌入模型是如何得到的呢，例如Google开发的Word2Vec模型，还有其他高级的嵌入模型如BERT和GPT系列，它们通过更复杂的网络结构捕捉更深层次的语义关系。父chunk检索，也叫自动合并检索，即递归地将document分割成若干较大的父chunk，其中包含较小的子chunk，能搜索更细粒度的信息，将document分割成层次chunk结构，最终索引的是叶子chunk的embeddi

2048 AI社区

专科生必看！10个高效降aigc工具推荐

2048 AI社区

RAG技术深度解析：构建新一代智能问答系统的核心架构与优化策略

RAG技术（检索增强生成）通过结合检索的准确性与生成的流畅性，解决了传统AI问答系统的局限性。文章详细解析了RAG的三大核心模块（检索、增强、生成）及其技术演进，提供了检索优化、生成优化的实战策略与代码示例。同时介绍了性能优化方法、多维评估体系及企业知识库、智能客服等应用案例。文章指出RAG未来将向多模态、实时学习方向发展，但也面临计算资源、长文本处理等挑战。RAG技术为构建可靠智能问答系统提供了