AgentAI 产品形态: Cursor的技术路线
·
开发者分享原视频
技术迭代
初代Tab(2023)
- 启发来源: GitHub Copilot
- 功能: 自动补全
- 实现方式:
- 用户接受答案(正例),用户不接受(负例), 通过RL, 30分钟后模型优化
- 需要权衡质量, 速度, 用户体验: 效果差的时候推荐, 效果好后补全
Composor(2023)
- 对话式UI, 对多文件coding
- 技术发展: 上下文窗口增大
- 功能:通过prompt, 把上下文,当前最近的code的语句放入prompt
当前cursor( Agent 2024, 完全自主)
上下文工程
- 使用更多token
- 自动收集上下文
- 这里需要注意的是, 并不是要把token上限占满, 而是要选有意义的Context
工具使用(RAG?):
codebase search
- grep 命令: 作为tool
- 语义匹配: 自动索引代码库, 创建embedding
- 提升匹配度: embedding模型自训练 + A/B test
- 离线对厚重数据进行索引, 在线查找
- 合并这种搜索
阶段性的产品形式:
- CLI
- Bugbot: 帮助找代码中的逻辑错误
抽象逻辑概念: plan, memory、rule
并应用到真实项目中去
- plan模式:
- 如何存储计划
- 如何编辑文件
- 给模型新的tool
- 维护一个to-do list
- 关键上下文, 类似一个可以随时参考的笔记
- todo list + code 是唯一事实来源(?)
- Command, Rules,
- Command: 自定义命令, 允许share prompt
- rules: 允许在每次agent对话中, 包含的重要上下文
- 打包 commit standard + guidelines 放入 ./commit 可以放到ticket(工单?)
人工介入与Hook
- Hooks: 介入agent运行的每一部分, 允许tab单步agent执行的每一个hook
- 举个栗子: 代码编完成后, 执行一个脚本
模型的迭代效益
- 大模型迭代带来的效益: 不需要精确地prompt
MultiAgent组合:
- 前后太的组合
- 前台: 正在编辑 (local)
- 后台执行agent 并行运行(云, 长期)
- 本地的多智能体需要考虑的内容:
- 监控不同端口
- 管理, 调试数据库
- git: 需要维护多个版本
- agent之间的竞争
- 本地的多智能体需要考虑的内容:
代码的evaluation(cursor的自验证)
- 要求使用浏览器,
- 对dom文件的快照?
- 对已创建的页面的反馈
未来发展方向:
人需要完成的任务
- 系统设计
- 代码审查
agent
- 可以理解代码库, 团队风格, 产品理念
- 提出想法, 帮助探索新方向
- 将复杂项目分解成可以接受、拒绝、待完善的部分
- 难题: 提供agent 尝试了的方向, log,
目前已有的一些工具:
cursor, codex, claude code(可以支持self-host? todo)
更多推荐

所有评论(0)