如何使用通义千问（Qwen）大模型的 OpenAI 兼容 API 构建 AI 聊天应用

本文介绍了如何使用通义千问的 OpenAI 兼容 API 构建 AI 聊天应用。快速集成：兼容 OpenAI 接口，降低迁移成本高性能：通义千问模型具备强大的理解和生成能力灵活部署：支持多种部署方式，适应不同需求成本可控：按量付费，可根据预算灵活调整个人项目和原型验证企业客服系统内容创作辅助工具智能问答系统。

꯭꯭听꯭风꯭者꯭

109人浏览 · 2026-01-31 22:21:15

꯭꯭听꯭风꯭者꯭ · 2026-01-31 22:21:15 发布

随着人工智能技术的快速发展，大语言模型已成为现代应用开发的重要组成部分。阿里云的通义千问（Qwen）系列模型凭借其卓越的性能和丰富的功能，受到了广泛关注。本文将详细介绍如何利用 Qwen 模型的 OpenAI 兼容 API 构建一个完整的 AI 聊天应用。

API 密钥管理

获取 API 密钥

要在项目中使用通义千问模型，首先需要在阿里云平台上获取 API 密钥：

访问阿里云控制台，注册并登录账户
进入通义千问产品页面，开通服务
在控制台中找到 API 密钥管理页面，创建新的 API 密钥
将生成的密钥妥善保存，注意首次生成后需要立即复制保存

安全存储最佳实践

API 密钥是访问服务的重要凭证，必须严格保护。以下是几种安全存储方式：

1. 使用环境变量

在项目中，我们采用环境变量来存储 API 密钥，避免直接硬编码到代码中：

# .env.local - 本地开发配置（不应提交到版本控制）
OPENAI_API_KEY=your_actual_qwen_api_key_here
OPENAI_API_BASE=https://dashscope.aliyuncs.com/compatible-mode/v1
MODEL_NAME=qwen-max

2. .env.local vs .env.example

.env.local: 存储实际的敏感信息，如真实 API 密钥，应添加到 .gitignore 中避免提交
.env.example: 仅作为模板文件，包含占位符而非真实密钥，可以安全地提交到版本控制系统

# .env.example - 示例模板文件
OPENAI_API_KEY=your_qwen_api_key_here
OPENAI_API_BASE=https://dashscope.aliyuncs.com/compatible-mode/v1
MODEL_NAME=qwen-max

这种分离方式既保证了团队协作的便利性，又确保了安全性。

基础调用方法

OpenAI SDK 兼容调用

通义千问提供了 OpenAI 兼容模式，使得现有基于 OpenAI SDK 的项目可以轻松迁移。以下是完整的 Node.js 调用示例：

import OpenAI from 'openai';

// 创建兼容 OpenAI 格式的客户端
const client = new OpenAI({
  apiKey: process.env.OPENAI_API_KEY || '',
  baseURL: process.env.OPENAI_API_BASE || 'https://dashscope.aliyuncs.com/compatible-mode/v1',
});

// 发送聊天补全请求
const response = await client.chat.completions.create({
  model: process.env.MODEL_NAME || 'qwen-max',
  messages: [
    { role: 'system', content: 'You are a helpful assistant.' },
    { role: 'user', content: 'Hello!' }
  ],
});

流式响应实现

为了提供更流畅的用户体验，我们可以实现流式响应：

// 流式响应示例
const stream = await client.chat.completions.create({
  model: process.env.MODEL_NAME || 'qwen-max',
  messages,
  stream: true,  // 启用流式响应
});

// 处理流式数据
for await (const chunk of stream) {
  const content = chunk.choices[0]?.delta?.content;
  if (content) {
    // 实时输出内容
    process.stdout.write(content);
  }
}

在 Next.js API 路由中，我们还可以将流式响应转换为 Server-Sent Events (SSE)：

// Next.js API 路由中的流式响应处理
export default async function handler(req: NextApiRequest, res: NextApiResponse) {
  // 设置 SSE 响应头
  res.setHeader('Content-Type', 'text/event-stream');
  res.setHeader('Cache-Control', 'no-cache');
  res.setHeader('Connection', 'keep-alive');
  res.setHeader('Transfer-Encoding', 'chunked');

  for await (const chunk of stream) {
    const content = chunk.choices[0]?.delta?.content;
    if (content) {
      res.write(`data: ${JSON.stringify({ content })}\n\n`);
    }
  }

  // 发送结束信号
  res.write('data: [DONE]\n\n');
  res.end();
}

核心特性

1. 流式输出支持

流式输出能够实时显示模型生成的内容，显著提升用户体验。相比等待完整响应后再显示，流式输出让用户感觉响应更加即时。

2. OpenAI SDK 兼容

通过兼容 OpenAI 接口，开发者可以：

无需学习新的 API 规范
轻松迁移现有项目
复用现有的工具链和库

3. 全栈一体化部署

基于 Next.js 的全栈架构优势：

单一代码库管理前后端
服务端渲染提升 SEO
API 路由与前端页面统一部署

4. 完善的错误处理

系统内置了对常见错误的处理机制：

try {
  // API 调用
  const response = await client.chat.completions.create({...});
} catch (error: any) {
  if (error.status === 401) {
    // 认证失败
    errorMessage = 'Authentication failed. Please check your API key.';
    statusCode = 401;
  } else if (error.status === 429) {
    // 请求频率超限
    errorMessage = 'Rate limit exceeded. Please try again later.';
    statusCode = 429;
  }
  // 返回错误信息给前端
  res.status(statusCode).json({ error: errorMessage });
}

计费模式与使用限制

计费方式

通义千问采用按量付费模式，主要根据 token 数量计费：

输入 token：用户发送的消息内容
输出 token：模型生成的回复内容
费用计算：输入和输出 token 分别计费

模型版本对比

模型	特点	适用场景	价格
qwen-turbo	高效推理，成本低	简单任务，高并发	最经济
qwen-plus	平衡性能与成本	一般性任务	中等
qwen-max	强大推理能力	复杂任务，逻辑推理	性能最强

限制参数

速率限制：通常有每分钟请求数（RPM）和每秒查询数（QPS）限制
上下文长度：最大支持 32768 tokens，可处理长文本
单次请求限制：根据模型版本有所不同

成本优化建议

合理选择模型：根据任务复杂度选择合适的模型版本
控制输出长度：设置最大令牌数限制，避免不必要的输出
缓存高频响应：对常见问题的回复进行缓存
批量处理：在允许的情况下合并请求以减少 API 调用次数

总结与项目推荐

本文介绍了如何使用通义千问的 OpenAI 兼容 API 构建 AI 聊天应用。这种方案具有以下优势：

快速集成：兼容 OpenAI 接口，降低迁移成本
高性能：通义千问模型具备强大的理解和生成能力
灵活部署：支持多种部署方式，适应不同需求
成本可控：按量付费，可根据预算灵活调整

该方案特别适用于以下场景：

个人项目和原型验证
企业客服系统
内容创作辅助工具
智能问答系统

示例项目

本文所述的完整示例项目已开源，欢迎克隆、运行和贡献改进：

项目地址:
https://github.com/zhangjian24/llm/tree/main/qwen-chatbot

https://gitee.com/codehub/llm/tree/main/qwen-chatbot

项目包含完整的 Next.js 前端界面、API 路由、环境配置和详细文档，可直接运行体验。如果您有任何疑问或改进建议，欢迎提交 Issues 或 Pull Requests！

通过这个项目，您可以快速上手通义千问 API 的使用，并在此基础上开发自己的 AI 应用。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

让文本数据准备好供 AI 使用

发表于·7 分钟阅读·2024 年 10 月 4 日展示处理杂乱数据的图形。图片由作者使用 ChatGPT-4o 制作。人们使用大型语言模型在来自不同来源的文本数据上执行各种任务。这些任务可能包括（但不限于）编辑、总结、翻译或文本提取。这个工作流程的主要挑战之一是确保你的数据是 AI-ready。本文简要概述了 AI-ready 的含义，并提供了一些无代码解决方案，帮助你达成这一目标。我们被来自不

2048 AI社区

惊艳全场！AI应用架构师的AI评估系统研究成果

技术侧：响应时间0.1秒（行业优秀水平），吞吐量200 QPS（能扛大促）；上线前：老板问“这系统能帮公司赚多少钱？”，小杨只能说“应该能提升转化率”；上线后：转化率涨了5%（不错），但用户投诉率涨了10%（因为推荐的商品“太套路”）；更崩溃的是：某天大促，系统突然崩了——因为没评估“高并发下的稳定性”；最后老板问：“这系统到底好不好？”，小杨支支吾吾说不出话。"""计算性能得分（响应时间+吞吐量