Qoder 全形态产品家族正式发布,并开源 Agentic Coding 产品耐用度评测集
阿里巴巴发布Qoder智能编程平台,定位为面向真实软件的下一代智能体编程平台。该平台提供三种产品形态(IDE、JetBrains插件和CLI),支持从辅助编程到AI自主编程的全场景覆盖。核心能力包括增强上下文工程、隐性知识显性化和Spec驱动开发,可处理10万级代码文件的复杂工程。通过Quest模式实现任务异步委派,结合云端沙箱可实现10倍效率提升。平台采用全球顶尖模型与自研专项模型结合的技术方案
各位开发者大家好,欢迎来到 Qoder 全形态产品发布。我是 Qoder 负责人丁宇。Qoder 是阿里巴巴推出的面向真实软件开发的下一代智能体编程平台。今天很高兴带来了 Qoder 全形态的能力升级。
今天,人类与 AI 的协作方式进入了 Agentic Coding 时代。人们对大语言模型的应用逐步从知识检索过渡到了任务自动化。随着时间的推移,大语言模型正在以更自动化的方式被使用,人们更倾向于将完整的任务委托给人工智能执行。
我们也看一下人们是如何使用 ChatGPT。在工作相关的实际使用中,基于任务执行的用量占比最大,Doing 远远大于 Asking。从过去的简单任务到今天可以执行复杂任务,从过去只能面向符号语言到今天可以全面处理自然语言。我们看到自然语言成为了新的编程语言,代码的编写逐步由 AI 接管。需求洞察、描述意图、编排逻辑、验收结果成为当下开发者最高频的工作内容。

超过 95% 的开发者每天都在构建真实软件。真实软件积累的时间长、复杂度高、价值产出大,需要更强的上下文和模型处理能力。而代码今天成为现实世界与物理世界的连接器,成为了人工智能的双手和执行器。更多的场景和需求的数字化将会带来软件需求的倍增。
面对这些需求和趋势,今天我们带来 Qoder 产品的全景图。Qoder 的核心定位是 Agentic Coding Platform for Real Software。这里面有两个关键词:第一个是面向真实软件,第二个是智能体编程平台。
产品架构与真实软件挑战
Qoder 产品分为三层:最下面是基础设施,即大语言模型和 AI Infra,这里面包含了全球顶尖模型和自研专项模型。在核心技术上我们覆盖了自动化调度模型选择器,包括对模型的评估、评测,用户问题意图的理解以及任务复杂度等,以及对于模型进行智能调度。Qoder 提供了多智能体架构,上下文引擎,对于工具集和工程感知能力。

在这之上是交互创新层。我们提供了三种产品形态:面向 VS Code 开发者,我们提供了 Qoder IDE;面向 JetBrains IDE 开发者,我们提供了 JetBrains 插件;面向终端和智能体被集成的场景,我们提供了 Qoder CLI。用户可以在不同的产品形态上获得同样的 Qoder 能力,底层的基础设施是全面复用的。
那我们先来看 Qoder 的第一个核心定位:为真实软件研发而生。
真实软件研发面对很多的挑战:
一是真实软件工程规模大,复杂度很高。在从 1 到 100 的研发过程中,涉及到存量工程的长期迭代和维护,同时需要遵循组织内的多种规范要求和框架约束。
二是有大量的暗知识,知识不对齐。人与人知识不对齐导致沟通协作成本高,人与 AI 的知识不对齐,导致 AI 生成的效果不达预期。
三是只关注实现、忽视需求澄清和结果验证。开发者很多精力都在考虑如何去实现代码,而不是去需求澄清和结果验证。这大量繁琐的 Coding 工作占据开发者大部分的时间,而意图澄清、需求对齐和结果验收上投入不足,会导致我们很多的时候会出现返工和延期。
应对策略
面对这三个挑战,我们提出了三个应对策略。

第一个是增强上下文工程。增强对代码工程的理解,更强的检索能力让 AI 更懂复杂工程。通过记忆&个性化上下文,让 AI 在实际编码过程中更懂得用户行为偏好。
第二,隐性知识显性化。通过代码和提交历史来生成知识文档,完成复杂代码工程的结构化梳理,促进软件工程的可见性提升,降低人的认知负载,完成人与 AI 的知识对齐。
第三,Spec 驱动开发。先编写规范,明确需求,再委派 AI 研发实现,最后校验结果。更少的过程态交互,更长的执行时间,交付更优质、可预期的结果。
通过这三个策略和能力,可以更好地服务于真实软件研发,产生更多价值。
智能体编程演进
Qoder 第二个定位:智能体编程平台。我们今天看到行业有三个趋势:从辅助编程、协同编程到 AI 自主编程,AI Coding 的自主滑块正在向右迁移。

2023年,出现了 AI 辅助编程。它的产品形态是代码补全、NES,对研发提效有 30% 左右的提效效果。2024年出现了协同编程。AI Coding 工具可以在工程内进行多文件的编辑、需求的编写,在这个过程中可以有接近 100% 的提效效果。2025年,我们看到出现了 AI 自主编程,可以进行大块任务的自主开发。开发者可以进行任务委派,这过程中就可以有一倍以上的提效。
Qoder 的定位是致力于服务最广泛的开发者群体,同时覆盖这三类编程场景。同时我们也在探索更多的 AI 自主编程能力,进一步释放生产力。
Agent模式
我们看一下 Agent 模式。基于对话的智能体实时协作,深入理解工程上下文和工具。Agent 可以大规模生成上下文感知的代码,显著提升研发效果和准确度。
通过 TO-DO 列表打开智能体执行的黑盒,将任务结构化,确保智能体执行任务的准确性。Qoder 内置的代码检索引擎可以一次性检索 10 万个工程代码文件,保证对于工程的理解效果。
任务委派模式:Quest
因为随着 AI 自主性的提升,执行的任务越来越长,它就有机会过渡到异步委派的模式。因为实时结对它是一个开发者和 AI 请求响应式工作模式,这样的话大家是同步阻塞的关系,所以它的工作时间是受限于人的工作时间。
随着 AI 的能力越来越强,自主性越来越强,我们可以进入到异步委派的模式。开发者通过 Spec 结构化的表达意图,然后把任务一个一个委派给智能体并行执行,这样就可以大幅地提升生产力。

我们看一下 Qoder 支持三种委派模式。第一种本地异步委派,只需要描述需求,智能体就可以自主规划、执行、交付,来实现本地开发任务的异步委派,开发者可以专注在核心逻辑和主线创新。
第二种就是本地并行多任务。通过 Git Worktree 为每个任务分配独立的工作空间,本地多任务协作可以做到无缝流转。对于开发者,它可以多线程推进的同时,不必担心环境相互干扰。
第三种就是委派到云端沙箱。将任务调度到云端沙箱,多任务并行执行,可以打破时空的边界。因为云端沙箱里面算力无限、时间无限、并发度无限,不管是开发者下班、关上电脑、关机,云端都可以长时间运行,这样的话可以实现 10 倍的效率提升。

为此我们推出了 Quest Mode:Spec 驱动的 AI 自主编程。Spec 对于开发者来说是最熟悉的意图表达方式,设计文档是人与人、人与 AI 之间主要的沟通媒介。开发者的主要工作就变成了明确任务意图、协作生成设计文档、最终确认执行结果。有了 Quest 可以将研发任务异步委派,真正做到 10 倍研发提效。
JetBrains插件全新上线
接下来我们看一下 Qoder JetBrains 插件。通过与 JetBrains IDEs 深度集成,带来后端工程的深度感知,让 AI 更好的理解框架规范、数据库结构和运行时环境。

JetBrains 插件有四个核心优势。
第一,框架语义深度理解。获取 Spring、FastAPI、Gin 的依赖关系、路由配置、中间件结构,提供符合框架规范的代码建议。
第二,数据库深度感知。自动分析完整的 Schema,提供 SQL 优化建议和注入风险检测,让数据库操作更准确、更安全。
第三,框架即时理解。基于云端框架知识引擎,自动识别项目类型,百毫秒解答 Bun 等新工具的新版特性。
第四,IDE 能力深度融合。Spring Bean 依赖识别、Debugger 调用栈分析、Inspection 错误修复,基于 AST 和运行时信息的深度感知。Qoder 做到了真正的理解后端技术栈。
Qoder CLI:让 Qoder 能力随处可用
接下来我们看一下 Qoder CLI。用户可以在 IDE 做深度开发,用 CLI 做快速操作与流程自动化,两者结合显著提升工作效率。

Qoder CLI 有三个核心优势。
第一,灵活轻量、开箱即用。在服务器上临时修 bug,快速代码审查,无需打开IDE,在70毫秒以内可以快速启动。在任何终端都可以获得完整的 Qoder 能力。
第二,流程自动化、流程自定义。集成了 CI/CD 流水线,自动化的代码审查、测试生成和问题修复,从本地到生产环境全链条覆盖。可以调度智能体、编排工作流,实现研发流程自定义,满足企业化场景的需要。
第三,深度被集成,融入任何工具链。在脚本里调用 Agent,通过管道串联 + ACP 协议,可以编排进任何工作流。为 Emacs、Neovim 等 IDE 提供支持,让 Qoder 能力随处可用,Qoder CLI 把 Qoder 的智能带到每一个终端。
多端平权与技术竞争力
我们的理念是多端平权。每位开发者都有最习惯的开发环境,Qoder 让开发者在任何环境都能 Agentic Coding。我们提供了三方面的能力。
-
第一就是多端智能体覆盖。Qoder 尊重每一位开发者的使用习惯。
-
第二是一体化智能底座。多端共享统一的智能引擎,自适应模型调度和云端沙箱,Agent 能力全端复用,云端沙箱随需开启,统一底座,能力一致。
-
第三就是无边界生态集成。Qoder 可以融入 GitHub PR、CI/CD 流水线、自建研发平台,让 Agentic Coding 能力覆盖更多场景,成为随处可用的基础设施。

我们在持续提升 Qoder 的技术竞争力,构建了三方面的能力。
第一,业绩领先的增强上下文工程。通过云端代码检索,融合 Repo Wiki 文档知识以及自优化的记忆感知技术,Qoder 可以精确理解 10 万个代码文件,编码效果在复杂评测中领先 13%。
第二,自优化的记忆感知能力。通过动态学习机制,自动从历史对话中挖掘用户习惯、工程信息、历史经验,并通过记忆质量评估、有效性评估等特征维度,自主优化记忆检索策略,使智能体对话质量提升 48%。
第三,全球顶尖模型与自研模型结合。我们使用全球顶尖模型加上专项训练的自研模型,像代码补全/NES、向量检索、Wiki 生成等,通过 Qoder Bench 大规模评测体系验证,效果拔群,Repo Wiki 模型 Credits 消耗节省 93%。
Qoder Bench、开源与未来
接下来介绍一下 Qoder Bench。它是一个端到端的自动化评测,从效果、速度、成本等多维度还原开发者真实使用体验。在模型层支持全球顶尖模型和自研专项模型,在工程层去支持工程感知、长/短期记忆、提示词、工具、Agent 框架,场景层多种编程语言、多种任务类型、多种技术难度。
在 Qoder Bench 里提供了 Qoder 自动化评测框架,通过实时评测、线上 A/B Test、高度自动化&并行化的回归,可以进行快速评测。同时构建了海量的评测集,覆盖多场景、多语言、多模态。Qoder Bench 是我们产品快速迭代、持续领先的保障。
通过 Qoder Bench + 真实软件评测,Qoder 在复杂工程、生成效果、Credits 耐用度方面全面超越全球头部产品,支持高达 10 万个文件的超大工程,在复杂任务评测集中综合效果评分领先 13%。在同样的付费金额、同样的 SOTA 模型下,可以完成 205% 的编码任务。

今天我们正式开源 Agentic Coding 产品耐用度评测集。
它有两个特点。第一,语言覆盖广,涵盖了 Agentic Coding 用户最常用的编程语言,包括 Python、JavaScript、TypeScript、Java、Golang 等。
第二,技术栈多样化,每种语言有针对性覆盖主流和较新的技术框架,还原开发者高频的开发环境和使用场景。这种跨多种语言、工程难度各异、贴近真实场景,完全可以用于对比不同的 AI Coding 产品耐用度和实现效果。
目前已经开源了 20+ Case,计划在 2026 年 3 月之前开源 50+ 评测 Case,欢迎开发者下载和使用。

开源地址: https://github.com/agentic-coding-durability-evalset
未来 Qoder 将实现多场景覆盖,拓展更多的开发者触达入口。包括我们看到今天的产品形态:IDE、插件、命令行和通过 ACP 集成了多种其它的 IDE,包括我们去支持 Github、Gitlab,我们支持各种协同工具 Slack、Notion、钉钉等。
基于统一的云端环境和统一的智能体能力,多场景、多触点的管理研发任务,修改技术实现,解决业务问题。开发者可以以任何设备和工具接入,管理研发工作流,围绕同一个 Repo 进行任务协同、进度管理、工作安排,真正做到无处不在的 AI Coding。
我们看两个例子。第一个,Github + Qoder Agent 实现 CodeReview。Qoder CLI 通过与 Github 深度集成,可以在几分钟内提供有关拉取请求上下文反馈,进行高质量代码审查,减少人工代码审查的时间精力投入。经过评测和比对,可以提升 2 倍的代码审查质量,提升 10 倍的代码审查效率。

第二个案例,Github + Qoder Agent 做Bugfix。针对 Qoder CLI 在 Github 里的代码审查结果,可以在评论里直接 @QoderAI 进行问询,要求智能体进行相应的问题修复。经过评测,可以提升 10 倍的 Bugfix 效率。

希望所有开发者可以借助 Qoder 释放更大的生产力。
若需要阅读原文请点击下列链接,包含官方直播视频:
https://mp.weixin.qq.com/s/evvUbTjgq36VHZjypEcfZg
更多推荐

所有评论(0)