文章信息:

字数:约4200字 | 阅读:12分钟 | 难度:⭐(小白友好,无需技术基础)

核心价值:手把手教你在自己的电脑上跑一个真正可用的AI模型,断网也能用、数据不上云、反应飞快


还记得第一次用 ChatGPT / DeepSeek 的时候吗?

打字进去,等它转圈圈,然后一段话回来——挺酷的。

但问题也很明显:

你永远在别人的服务器上。

网断了,没了。

高峰期,排队。

聊到隐私话题,心里打鼓。

我当时就想:有没有AI是装在我自己电脑里的?不用联网,不用等,什么东西问它都行?

之前折腾过docker部署DeepSeek,但因下载的模型太小,真正运行起来并不理想,但是现在....

有的,兄弟,包的。而且已经非常简单了。

并且好用!


把你电脑变成一个人工智能

我打个比方你就明白了。

你现在的电脑是一间毛坯房。

CPU是地基,内存是房间大小,硬盘是储物间。

装修需要请施工队(装软件)。

Ollama就是这个施工队。

它干一件事:

让你的电脑能跑AI模型。

装好了,你就像在毛坯房里铺了地板、刷了墙——可以住人了。

Qwen3(通义千问3)是通义家的开源模型,相当于你买的家具。

Ollama负责把家具搬进来摆好,你要做的就是选这套家具里的哪一件。

为什么是Qwen3不是ChatGPT?

因为它免费、不联网、数据不上云、还支持中文。

不是ChatGPT太贵,是Ollama+Qwen3你装一次就一辈子是自己的。


第一步:选对设备(决定你的体验)

Ollama不挑电脑,但不同配置决定了你选哪个模型。

如果你是Mac用户

关键看内存,不是CPU。

内存 推荐模型 体验
8GB qwen3:4b(2.5GB) 能用,轻度聊天
16GB qwen3:8b(5.2GB) ⭐ 推荐,完美跑
24GB qwen3:14b(9.3GB) 高质量,写作翻译很强
32GB+ qwen3:32b(20GB) 接近GPT的水平

一句话:16GB以上选qwen3:8b,24GB以上选qwen3:14b。别一上来冲最大模型,先跑通再升级。

MacBook Pro > MacBook Air。因为Air没有风扇,跑模型时间长了会发热降频。但短时间试用完全没问题。

如果你是Windows用户

关键看显存(VRAM),不是内存。

Windows和Mac最大的区别:Mac用的是共享内存(RAM),Windows用独立显存(VRAM)。

显卡 显存 推荐模型
无独显(纯CPU) qwen3:0.6b(523MB,纯CPU可跑)
GTX 1650 / RTX 3050 4GB qwen3:4b(2.5GB)
RTX 4060 / 4070 8GB qwen3:8b(5.2GB)⭐ 甜点模型
RTX 4080 / 4090 16GB+ qwen3:14b(9.3GB)或qwen3:32b(20GB)

纯CPU也能跑,9B模型约10个token/秒(大约一秒蹦几个字),慢但能用。

硬核知识(内行看的):

Mac用统一内存架构(UMA),CPU和GPU共用同一块RAM。

Windows用独立显存,模型必须完全或部分加载到VRAM里才能用GPU加速。

所以8GB显存的Windows显卡(RTX 4060/4070)约等于Mac的16GB内存。

qwen3:8b的量化版本(q4_K_M)占用约5.2GB硬盘+6GB VRAM,是8GB显卡的完美甜点。


第二步:安装Ollama(3分钟)

Mac安装

方法一:官网下载(推荐)

  1. 打开 https://ollama.com
  2. 点一下 Download,会自动下载Mac版安装包
  3. 打开 .dmg 安装包,把Ollama拖到Applications里
  4. 打开启动台,点一下Ollama——顶部状态栏会多一个小羊驼图标 ✅
不用跑终端、不用配路径、不用装依赖。双击就完了。

方法二:终端一行命令

适合喜欢用命令行的朋友:

Windows安装

方法一:下载安装包(推荐新手)

  1. 打开 https://ollama.com/download
  2. 下载 OllamaSetup.exe
  3. 双击运行,一路默认
  4. 安装完后,系统托盘会出现Ollama的羊驼图标 ✅
Windows版本无需管理员权限,默认装在用户目录下。如果C盘空间紧张,安装时可以指定路径。

方法二:一行命令安装

打开PowerShell(右键开始菜单 → Windows PowerShell),粘贴:

irm https://ollama.com/install.ps1 | iex

如果提示执行策略被阻止,用这个:

powershell -ExecutionPolicy Bypass -Command "irm https://ollama.com/install.ps1 | iex"
Windows用户注意:如果装了360/腾讯电脑管家,安装时可能会弹窗拦截。允许通过就行。

第三步:下载并运行你的第一个AI模型(2分钟)

不管Mac还是Windows,安装好后打开终端(Mac用终端.app,Windows用PowerShell),输入:

ollama run qwen3:8b

第一次运行它会自动下载模型(约5.2GB),取决于你的网速,等几分钟就好。

下载完你就看到这个:

>>> Send a message (/? for help)

恭喜,你的电脑已经成了一个AI。 🎉

试着跟它聊两句:

>>> 用一句话解释为什么程序员喜欢半夜写代码?

它会回答你。实时生成,逐字出现,没有加载转圈,没有任何「服务器繁忙」。

>>> /exit

退出用 /exit 或 Ctrl+D。

下次再聊,输入同样的命令,

模型还在——不用重新下载。


第四步:给AI装个图形界面(3分钟)

终端聊天虽然很硬核,但确实不太方便。推荐装一个图形界面。

Open WebUI(推荐,功能最全)

Docker安装:

docker run -d -p 3000:8080 \
  --add-host=host.docker.internal:host-gateway \
  -v open-webui:/app/backend/data \
  --name open-webui \
  --restart always \
  ghcr.io/open-webui/open-webui:main

然后浏览器打开 http://localhost:3000,注册一个账号(存在本地),就能看到和ChatGPT一样的界面了。

Python安装(不用Docker):

pip install open-webui
open-webui serve

浏览器打开 http://localhost:8080。

其他桌面客户端

不想折腾Docker的,这几个直接用:

工具 平台 一句话
Chatbox Win/Mac/Linux 最好用的AI桌面客户端,支持Ollama
Cherry Studio Win/Mac 中国人的ChatGPT桌面版
AnythingLLM Win/Mac/Linux 带知识库的AI应用
Msty Win/Mac 极简多模型客户端

去各自官网下载安装,配置里填Ollama的API地址 http://localhost:11434 就行。

还有ollama原生的 Chat -UI


模型怎么选?一张表说清楚

推荐组合(按配置)

你的配置 首选模型 理由
Mac 16GB / Win 8GB显存 qwen3:8b 完美适配,中文好,支持工具调用
Mac 24GB / Win 16GB显存 qwen3:14b 高质量,写代码写文章都强
Mac 32GB / Win 24GB显存 qwen3:32b 接近云服务水平
纯CPU低配 qwen3:4b 轻量级,基本够用
想要推理能力 deepseek-r1:8b 推理模型,逻辑分析强

模型管理命令

ollama list              # 看我下载了哪些模型
ollama pull qwen3:8b     # 手动下载一个模型
ollama run qwen3:8b      # 运行一个模型
ollama ps                # 看当前加载了哪些模型
ollama rm qwen3:8b       # 删除一个模型
ollama stop qwen3:8b     # 卸载模型释放内存

国内模型全家桶

Ollama支持的通义系、DeepSeek、智谱GLM都在这里:

模型 大小范围 擅长
Qwen3 0.6B-235B 全面,中文好,推荐入门
DeepSeek-R1 1.5B-671B 推理能力强
GLM-4/5 9B 中文能力突出
MiniMax-M2 - 编码和Agent工作流

五个技巧:

技巧1: "从 qwen3:8b 开始" "完美适配大多数配置"

技巧2: "显存不够?" "试试 qwen3:4b 或 0.6b"

技巧3: "需要推理?" "切换到 deepseek-r1:8b"

技巧4: "定期清理" "用 ollama rm 删除不用的模型"

技巧5: "内存不够?" "用 ollama stop 释放内存"


把Ollama接入OpenClaw:你的本地AI也能接入Agent

很多朋友把openclaw部署在云上,但如果你在本地用自己的OpenClaw搭AI助手,

Ollama可以作为模型后端直接接入——不需要任何其他的付费 API Key,不依赖云服务。

配置非常简单。

在OpenClaw的配置文件中,增加一个Ollama provider:

# config.yaml
models:
  providers:
    ollama:
      baseUrl: "http://127.0.0.1:11434"   # 你的Ollama地址
      models:
        - id: "qwen3:8b"
          name: "qwen3:8b"

agents:
  defaults:
    model:
      primary: "ollama/qwen3:8b"          # 用本地模型
      fallbacks:
        - "ollama/qwen3:14b"

然后设置环境变量让OpenClaw知道用Ollama:

export OLLAMA_API_KEY="ollama-local"

跑通验证:

openclaw models list --provider ollama
openclaw infer model run --model ollama/qwen3:8b --prompt "Reply with exactly: ok"

不需要API Key、不需要注册账号、不需要翻墙——OpenClaw直接调用你电脑上的Ollama,用你下载好的模型给你回答问题。

硬核知识:

OpenClaw对Ollama有原生支持,自动发现你ollama list里下载的所有模型。

Ollama provider不走兼容的OpenAI API路径(/v1/chat/completions),而是使用原生/api/chat接口,工具调用和流式输出更稳定。

你甚至可以用Ollama模型做OpenClaw的视觉理解后端,只要拉一个支持图片的模型(比如qwen2.5vl:7b)就行。

PS:更简单的方法,你安装完ollama并下载完模型后,直接告诉openclaw:

我已经通过ollama部署了本地LLM,请帮我接入:
--
《你下载的模型名称》
--

完事儿!恭喜你已经拥有了第一胎自己本地部署并且属于你自己的 LLM。

个人体感把它作为openclaw或者Hermes的副手LLM,去做一些文字处理的工作,会非常省token!


常见问题(踩坑记录)

Mac用户

发热正常吗?正常。Mac跑模型风扇会转起来,看活动监视器里的「内存压力」——绿色就安全。如果长期黄色或红色,说明模型选大了。

选MacBook Pro还是Air?长期跑模型选Pro。Air没风扇,模型跑久了会过热降频。偶尔玩一下Air没问题。

Windows用户

安装时提示执行策略被阻止?PowerShell默认限制执行远程脚本。用这个绕过:

powershell -ExecutionPolicy Bypass -Command "irm https://ollama.com/install.ps1 | iex"

防火墙弹窗怎么办?

本地用localhost:11434一般不触发防火墙。

如果你设了OLLAMA_HOST=0.0.0.0(允许局域网访问),Windows Defender会弹窗——允许通过就行。

装好后怎么改模型下载路径?

默认下载到 C:\Users\你的用户名\.ollama。

想改到D盘:

  1. 打开系统环境变量
  2. 新增变量 OLLAMA_MODELS,值设 D:\ollama_models
  3. 保存后重启Ollama(托盘右键退出 → 重新启动)

命令行显示方块乱码?

Windows 10旧终端字体会把Ollama的进度图标显示成方块。

把终端字体改成 Cascadia Code 或 Consolas 就好。

通用问题

下载模型太慢?国内网络环境下下载5GB左右的文件可能要等一会儿。建议:

  • 换个时间段试试(凌晨快一些)
  • 先跑个小的(qwen3:0.6b只有523MB)
  • 如果一直下载失败,可以用镜像站手动下载后放到 ~/.ollama/models/blobs/ 目录

Ollama和ChatGPT有什么区别?

本地AI(Ollama+Qwen3) ChatGPT
费用 免费 免费版有额度,Pro版$20/月
联网 不需要 必须联网
隐私 数据在本地,不上云 提问会上传OpenAI服务器
速度 实时(没有排队) 高峰期排队
能力 够用(写作/翻译/编码/答疑) 更强(联网搜索/多模态/插件)

所以不是本地AI比ChatGPT强,是本地AI是你的——不依赖任何人。


写在最后

做这件事其实起因特别简单——我一直觉得「AI应该装在自己电脑里」是一件理所当然的事。

但大部分人以为它很难。以为要懂编程。以为要有服务器。以为要花很多钱。

其实不需要。

你想写公众号文章的时候,可以让它帮你理思路。你想翻译一段英文的时候,不需要打开网页。你加班到半夜想找人说话,它就在那里,随叫随到。

本地AI的意义不是取代ChatGPT,是让你在任何时候都有一个AI队友。


但如果你不是一个人用,而是在一家企业

事情就不只是「方便」这么简单了。

2023年8月,《生成式AI服务管理暂行办法》正式施行。

加上《网络安全法》《数据安全法》《个人信息保护法》,企业使用AI的合规门槛已经非常明确:

员工问AI的问题里如果涉及客户信息、内部文档、商业数据,这些数据发到境外API(比如OpenAI),就是在做数据出境。

需要备案。需要安全评估。

出了任何事,责任全在企业方。

所以金融、医疗、政务这些行业,已经把「本地部署」当成了必选项,不是可选项。

Ollama + 企业知识库,是目前最成熟的开源方案。

核心思路很简单:

企业内部文档(PDF/Word/Wiki)
        ↓ 向量化
   本地向量数据库
        ↓ 检索匹配
   Ollama本地模型推理
        ↓
   员工得到答案(数据没离开过服务器)

整个链路,数据不出内网。

目前主流的方案里,几个值得关注的:

项目 一句话
AnythingLLM 60K 全离线运行,中小企业首选
Dify 142K 适合复杂工作流的中大型企业
RAGFlow 81K 文档解析能力最强(PDF/表格/OCR)
Langchain-Chatchat 38K 国产RAG方案,中文友好
而你需要的,就是十分钟和一台电脑。

#Ollama #Qwen3 #本地AI #大模型部署 #AI教程

🪪 作者:大象 — 推动让普通人轻松上手AI

相关阅读:

https://wcnoxi4wqsvx.feishu.cn/wiki/Rg5ZwOEz0idCiCkuECNcRJi5n7b https://wcnoxi4wqsvx.feishu.cn/wiki/BrHOwhYSWiMkQTkZaQbcQRwYn0g

https://wcnoxi4wqsvx.feishu.cn/wiki/Lol3wF5QwiWeJUkGukqcWkMinWh

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐