vllm部署大模型

(1）、下载大模型到本地，我使用魔塔社区中的大模型，先安装魔塔: pip install modelscope，然后使用运行download.py 从魔塔上下载大模型：python download.py。(3)、启动大模型： vllm serve /root/autodl-tmp/Qwen/Qwen3-0.6B。创建虚拟环境：conda create -n vllm python==3.12。

骑士999111

388人浏览 · 2025-09-05 18:38:12

骑士999111 · 2025-09-05 18:38:12 发布

1、申请服务器，我这里使用 autodl: AutoDL算力云 | 弹性、好用、省钱，GPU算力零售价格新标杆

自己去服务器上申请即可，我这里申请 4090 显卡，环境选择 python 12.4

2、vllm 安装

vllm官网： vLLM 是一个快速且易于使用的库，专为大型语言模型 (LLM) 的推理和部署而设计 | vLLM 中文站

使用vllm最好新建一个虚拟环境，我这里就使用vllm作为虚拟环境名称：

创建虚拟环境：conda create -n vllm python==3.12

激活虚拟环境：source activate vllm

3、安装vllm

(1）、下载大模型到本地，我使用魔塔社区中的大模型，先安装魔塔: pip install modelscope，然后使用运行 download.py 从魔塔上下载大模型：python download.py

(2)、安装 vllm： pip install vllm

(3)、启动大模型： vllm serve /root/autodl-tmp/Qwen/Qwen3-0.6B

默认是8000端口

4、调用大模型

运行test.py 文件，python test01.py

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

专科生必看！10个高效降aigc工具推荐，告别AI痕迹

2048 AI社区

如何在Ubuntu 22.04上部署并优化AI‑powered推荐系统，提升电商平台的个性化推荐效果？

在跨境电商平台项目中，用户数量快速增长，传统的基于规则（如最近浏览或热销商品）推荐策略已经无法满足用户日益增长的个性化需求。流失率在促销季节明显上升，尤其是在首页推荐和“猜你喜欢”模块。这促使我们引入AI‑powered推荐系统，通过数据驱动的模型来提升转化率与用户粘性。本文结合在Ubuntu 22.04生产环境上部署与优化AI推荐系统的完整过程，涵盖从硬件选型、软件组件到模型训练、服务化部署与性