人工智能基础篇:概念性名词浅谈(第二十四讲)
阿里巴巴推出的Qwen系列AI模型取得重大突破,Qwen3全系适配苹果MLX架构并开源32款量化模型。该系列包含7B到72B参数规模的密集模型与混合专家模型,Qwen3-Omni支持全模态处理,在36项基准测试中22项达顶尖水平。2025年11月被新加坡国家AI计划采用,取代Meta模型。Qwen2-72B性能超越Llama3-70B等主流模型,衍生出超1500款二次开发模型。阿里云通过开放开源战
大家好,今天继续讲述关于人工智能学习的基础篇。
(1)Qwen
Qwen是由阿里巴巴团队推出的智能聊天工具,基于Qwen语言模型构建,2025年6月17日发布的Qwen3系列全系适配苹果MLX架构并开源32款量化模型。该系统通过阿里云平台部署,提供网页版及千问APP服务,支持119种语言交互和跨设备应用,具备Chat Memory多轮对话记忆功能。其千问APP公测首周下载量突破千万次,全球累计下载量超6亿次,成为最广泛应用的开源大模型。
核心模型包括Qwen2.5-7B/14B-Instruct-1M,其中14B版本长文本处理效率较竞品提升7倍。Qwen3-Max模型在2025年AI大模型实时投资竞赛中两次夺冠,成为唯二盈利的中国模型。
旗舰产品Qwen3-Omni支持文本、图像、音频和视频全模态同步处理,在36项基准测试中22项达顶尖水平 。技术架构采用分阶段扩展上下文、Dual Chunk Attention和稀疏注意力优化,衍生模型Qwen3-Next通过MoE结构降低90%训练成本。2025年11月被新加坡国家AI计划采用,取代Meta模型。

Qwen是阿里巴巴团队推出的智能聊天工具,基于Qwen语言模型开发,现已发展为支持多模态处理的人工智能系统,2025年6月17日发布的升级版Qwen3全系适配苹果MLX架构并一次性开源32款官方量化模型。该系统提供网页版服务,通过阿里云平台部署,支持119种语言文本交互及跨设备应用,新增Chat Memory功能实现多轮对话记忆与个性化服务。阿里巴巴于2025年明确提出通义千问坚持开放开源路线,旨在构建类似AI时代的Android系统,并基于Qwen大模型开发个人AI助手千问APP,加入全球AI应用竞争 。
核心模型包含Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M等多个版本,其中Qwen2.5-14B-Instruct-1M模型在处理百万级长文本时效率较竞品提升近7倍。旗舰产品Qwen3-Omni作为原生端到端全模态模型,可同步处理文本、图像、音频和视频输入,支持30分钟长音频理解与211毫秒低延迟响应。技术特征包括分阶段扩展上下文长度、Dual Chunk Attention机制及稀疏注意力优化。
2025年11月被新加坡国家AI计划采用,标志着中国开源AI模型的全球关键扩张。

FCloud智能体训推平台已接入Qwen等主流大模型,通过OmniBot具身智能服务体系为机器人本体开发者提供从仿真训练到部署落地的全流程支持,服务于人形机器人研发企业的算法验证与量产落地。
该系统在张江金融数据港落地智算中心,为金融机构提供风险建模、智能投研等定制化训推服务,并与张江集团等合作构建公共智算底座。
平台已为生物制药、智能制造等领域客户提供服务,接入DeepSeek等主流大模型完成多领域应用部署。
2025年11月被新加坡国家人工智能计划(AISG)采用,在其东南亚语言大模型项目中采用Qwen开源架构取代Meta模型。
美国初创公司出于成本与性能考量,采用中国开源模型作为基础技术架构。

(2)Qwen2
Qwen2是由中国阿里云通义千问团队于2024年6月7日开发的开源语言模型系列,涵盖基础模型及指令调优版本,包含0.5B到72B参数规模的密集模型与混合专家模型(MoE)。该系列采用分组查询注意力(GQA)机制优化显存占用与推理效率 ,Qwen2-57B-A14B为MoE架构代表型号,全系模型通过新增27种语言数据及128K长上下文支持提升多语言理解能力,并针对性优化多语言场景中的语言转换问题。预训练模型在32K tokens数据上训练,使用7T tokens数据集在6000张A100 GPU上完成单个epoch训练耗时30天,并通过阿里云百炼平台提供API服务。
Qwen2系列包含5个参数版本,旗舰型号Qwen2-72B在斯坦福大学HELM MMLU测评中位列开源模型榜首,性能超越同期Llama3-70B等主流模型。其训练数据覆盖文本理解、代码生成等通用场景,通过魔搭社区、Hugging Face等平台开源并提供API服务,总下载量突破1600万次,衍生出超1500款二次开发模型。技术升级包括数学推理能力增强、YARN方法扩展上下文长度(指令微调模型支持128K tokens)及多模态生态扩展规划,已推出开源全模态大模型Qwen2-Omni、开源图像编辑大模型Qwen2-Image-Edit 、音频语言模型Qwen2-Audio [8]以及支持百万Tokens上下文的Qwen2.5-1M长文本模型。2025年1月27日发布的Qwen2.5-1M模型在处理长文本任务中稳定超越GPT-4o-mini,推理框架通过稀疏注意力机制实现近7倍提速。

2024年6月7日,阿里云更新技术博客:重磅发布开源模型Qwen2-72B,性能超过美国最强的开源模型Llama3-70B,也超过众多中国闭源大模型。所有人均可在魔搭社区和Hugging Face免费下载通义千问最新开源模型。当日,Qwen2系列模型的API第一时间登陆阿里云百炼平台。TensorRT-LLM、OpenVINO、OpenCompass、XTuner、LLaMA-Factory、Firefly、OpenBuddy、vLLM、Ollama等众多全球开源平台和工具,也第一时间宣布支持Qwen2最新款模型。
2025年11月17日,基于Qwen2模型的千问App正式公测。首日因用户流量过载导致部分服务短暂拥堵,官方通过@千问官微回应称系统状态已恢复,并强调其战略目标为打造覆盖办公、地图、健康等多场景的AI生活入口。
今天就讲这些,下篇文章见。
更多推荐


所有评论(0)