千问 3(Qwen3)模型家族正式发布了!这次不仅模型变强了,还带来了一个“杀手级”功能——思考模式与非思考模式的无缝切换

但在深入了解技术之前,为了不让大家走弯路,我们先根据您的身份,指引您去正确的地方:

🛑 必读:你是哪类用户?

👉 如果你是普通用户(小白/非技术人员)

  • 你的需求:不会写代码,只想聊天、写文章、做视频、找灵感。
  • 请直接访问小镜 AI 官网
  • 说明:注册就能用,像聊微信一样简单,不用操心任何技术细节。

👉 如果你是开发者(程序员/企业技术人员)

  • 你的需求:想获取 API Key,把 Qwen3 的能力接入到自己的软件、网站或 APP 里。
  • 请直接访问小镜 AI 开放平台
  • 说明:专为开发者设计,提供接口文档和调试工具。

一、Qwen3 家族成员:从“巨无霸”到“精锐小队”

这次 Qwen3 一口气拿出了很多好东西:

  1. 两位“重量级”选手(MoE 模型)
    • Qwen3-235B:这是旗舰级模型,虽然总参数巨大(235B),但在干活时非常聪明,只调用一小部分“脑细胞”(22B),效率极高。
    • Qwen3-30B:中等体型,性能与速度的平衡之选。
  2. 六位“全能”选手(密集模型)
    • 覆盖了从 32B 到 0.6B 的各种尺寸。无论你是要最强的脑力,还是要在手机端运行,都能找到合适的版本。

💪 战绩如何?
官方测试显示,旗舰版 Qwen3 在写代码、做数学题和通用能力上,全面超越了 DeepSeek-R1,甚至在很多方面能和谷歌的 Gemini 2.5 Pro 掰手腕。

二、最大亮点:自带“双脑”切换(混合模式)

以前我们用 AI,往往需要准备两个模型:一个负责“秒回”简单问题,一个负责“深思熟虑”解决难题。Qwen3 最大的突破就是把这两者合二为一了:

  • ⚡️ 非思考模式(快脑)
    就像人的直觉。当你问“今天天气怎么样”或“帮我翻译这句话”时,它秒回,不浪费时间。
  • 🧠 思考模式(慢脑)
    遇到复杂的数学证明或代码架构设计时,它会进入“沉思”,一步步推理,给你最严谨的答案。

这意味着什么? 开发者不需要部署两个模型了,一个 Qwen3 搞定所有场景。

三、语言天才:原生支持 119 种语言

Qwen3 简直是“地球通”。它不仅仅是能翻译,而是用 119 种语言进行了深度学习。无论你是用中文、英文,还是小语种,它都能直接听懂并流畅回答,不需要再进行繁琐的微调

四、它是怎么炼成的?(训练揭秘)

Qwen3 之所以强,是因为它“读的书”够多,“上的学”够久。

1. 数据量翻倍

它阅读了约 36 万亿个 token(词元)的内容,比上一代 Qwen2.5 翻了一倍!而且,它还专门向 Qwen2.5-Math(数学学霸)和 Qwen2.5-Coder(代码大神)这两位“老师”学习了合成数据,理科能力大幅提升。

2. 三阶段“上学记”

  • 小学阶段(基础能力):阅读 30 万亿通识内容,学会说话和基本常识。
  • 中学/大学阶段(专业强化):重点攻克 STEM(科学、技术、工程、数学)和编程,这部分内容占比提升到了 40%。
  • 博士阶段(长文本突破):阅读超长论文和技术文档,学会处理长达 32K 上下文的复杂任务。

3. 四步走的“思维训练”

这部分流程和 DeepSeek R1 有点像,但更进一步:

  1. 打基础:学会写推理步骤,拥有基本的逻辑。
  2. 探索创新:通过奖励机制,鼓励模型尝试非常规解法,变得更具创造力。
  3. 双修融合这是 Qwen3 的独门绝技。同时训练它“快问快答”和“深度推理”的能力,让它学会根据问题难易自由切换模式。
  4. 人类校准:通过各行各业(医疗、法律、金融等)的真实反馈,让模型的回答更符合人类偏好,更礼貌、更准确。

五、开发者如何快速接入?(只需三步)

如果你是程序员,想要在自己的应用里集成 Qwen3 的强大能力,操作非常简单:

第一步:注册拿“钥匙”
前往 小镜 AI 开放平台 注册账号。

第二步:创建 API Key
在后台创建一个 API Key。这就像是一串“密码”,是你代码调用 AI 能力的凭证。

第三步:开始调用
参考平台的开发文档,几行代码就能把这个超越 DeepSeek 的模型接入到你的系统中!

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐