大模型的部署与调用

在ApiFox配置参数，使用post请求方式，输入url，-d后面的就是我们需要写的请求体json格式内容，里面的content可以自行修改，就是你想问的问题。：下载Ollama，在官网选择你想使用的模型和版本，点击模型的名称，来到该模型的详情页面，并赋值右上角的命令。百炼平台对于大模型API的使用，给出了详细的参考文档，其中就包括http方式的调用，大家可以点击目标模型下方的API参考，查看详细

You,my exception

815人浏览 · 2026-01-16 16:10:42

You,my exception · 2026-01-16 16:10:42 发布

一、大模型部署

1.本地部署：使用Ollama

第一步：下载Ollama，在官网选择你想使用的模型和版本，点击模型的名称，来到该模型的详情页面，并赋值右上角的命令。(例如我选择的是qwen3-vl:2b)
在这里插入图片描述

第二步：打开命令行提示符窗口，执行这个命令，命令执行的过程中，会自动下载这个模型到电脑本地，并自动的运行起来，命令行提示符窗口如果自动进入到聊天界面，证明模型部署正确。
第三步：ollama平台也开放了API，程序员可以使用发送http请求的方式调用本地部署的大模型，这里咱们借助于Apifox工具调用大模型
在这里插入图片描述
在ApiFox配置参数，使用post请求方式，输入url，-d后面的就是我们需要写的请求体json格式内容，里面的content可以自行修改，就是你想问的问题。

2.云平台部署

部署大模型的平台常见的有阿里云百炼, 百度智能云, 硅基流动, 火山引擎等等，本文以阿里云百炼为例讲解具体的部署方式。
第一步：进入阿里云官网，找到产品->人工智能与机器学习->点击百炼->免费体验
第二步：申请一个API-KEY
在这里插入图片描述
第三步：发送http的方式调用大模型
百炼平台对于大模型API的使用，给出了详细的参考文档，其中就包括http方式的调用，大家可以点击目标模型下方的API参考，查看详细的文档。

根据这个参考，在ApiFox配置参数。注意：我们需要在请求头加上我们自己的API-KEY。
在这里插入图片描述

二、大模型调用

1.大模型参数

在这里插入图片描述
model: 告诉平台，当前调用哪个模型
messages: 发送给模型的数据，模型会根据这些数据给出合适的响应

content: 消息内容
role: 消息角色(类型)
- user: 回应用户消息，content就是我们用户在输入框输入的内容
- system: 系统消息，就是给你的系统指定一个角色，content就输入你想要让它是什么角色（比如客服，助理等等），设定了系统消息，他后面只能回答相关的问题，不相关的问题是不能回答的
- assistant: 模型响应消息，这个时候content输入模型之前响应的信息，让模型能根据记忆回答后面的问题

在这里插入图片描述

stream: 调用方式

true: 流式调用，每次生成一点就响应一点
false: 阻塞调用(默认)，完整返回

enable_search: 联网搜索，启用后，模型会将搜索结果作为参考信息

true: 开启，可以根据网络最新消息进行响应，否则他只停止于上次训练的日期
false: 不开启（默认）

2.响应数据

在这里插入图片描述
choices: 模型生成的内容数组，可以包含一条或多条内容
- message: 本次调用模型输出的消息
- finish_reason: 自然结束(stop)，生成内容过长(length)
- index: 当前内容在choices数组中的索引
object: 始终为chat.completion, 无需关注
usage: 本次对话过程中使用的token信息
- prompt_tokens: 用户的输入转换成token的个数
- completion_tokens: 模型生成的回复转换成token的个数
- total_tokens: 用户输入和模型生成的总token个数
created: 本次会话被创建时的时间戳
system_fingerprint: 固定为null，无需关注
model: 本次会话使用的模型名称
id: 本次调用的唯一标识符

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

OpenClaw(AI Agent) Ubuntu 系统部署教程（附带接入微信教程，使用阿里云百炼免费API）

本文介绍了OpenClaw大模型Agent的安装与配置指南。主要内容包括：1）准备工作，如开通阿里云百炼API并获取密钥；2）安装前置库及OpenClaw的两种方式（阿里云一键安装和官方文档安装）；3）配置模型服务，以kimi-k2.5为例；4）接入微信和企业微信的详细步骤，包括创建应用、配置服务器和验证流程。文章提供了完整的命令行操作和配置文件修改示例，帮助用户快速部署OpenClaw并与AI交

2048 AI社区

GEO 服务商怎么选？2026 年五大核心指标认证，首选智推时代

6大底层核心引擎打造跨模型语义适配、多模态知识转化、时序化品牌叙事、全链路归因分析、对抗性动态防御、预测性策略生成的全维度技术能力，其中对抗性学习机制可预判信源衰减、模拟竞品干扰，预测性策略生成实现从被动响应到主动塑造品牌AI生态心智的升级，同时依托跨模型语义工程构建主流大模型语义响应特征库，大幅提升品牌信息采纳率，为全链路GEO运营提供底层硬核技术支撑，实现品牌信息向大模型“可信知识”的高效转化