开发者分享原视频

cursor开发者,cursor技术演进

技术迭代

初代Tab(2023)

  • 启发来源: GitHub Copilot
  • 功能: 自动补全
  • 实现方式:
    • 用户接受答案(正例),用户不接受(负例), 通过RL, 30分钟后模型优化
    • 需要权衡质量, 速度, 用户体验: 效果差的时候推荐, 效果好后补全

Composor(2023)

  • 对话式UI, 对多文件coding
  • 技术发展: 上下文窗口增大
  • 功能:通过prompt, 把上下文,当前最近的code的语句放入prompt 

当前cursor( Agent 2024, 完全自主) 

上下文工程

  • 使用更多token
  • 自动收集上下文
  • 这里需要注意的是, 并不是要把token上限占满, 而是要选有意义的Context

工具使用(RAG?): 

codebase search

  • grep 命令: 作为tool 
  • 语义匹配: 自动索引代码库, 创建embedding
    • 提升匹配度: embedding模型自训练 + A/B test
    • 离线对厚重数据进行索引, 在线查找
  • 合并这种搜索

阶段性的产品形式:

  • CLI
  • Bugbot: 帮助找代码中的逻辑错误

抽象逻辑概念: plan, memory、rule

并应用到真实项目中去

  • plan模式: 
    • 如何存储计划
    • 如何编辑文件
    • 给模型新的tool
    • 维护一个to-do list
      • 关键上下文, 类似一个可以随时参考的笔记
      • todo list + code 是唯一事实来源(?)
  • Command, Rules,
    • Command: 自定义命令, 允许share prompt
    • rules: 允许在每次agent对话中, 包含的重要上下文
    • 打包 commit standard + guidelines 放入 ./commit 可以放到ticket(工单?)

 人工介入与Hook

  • Hooks: 介入agent运行的每一部分, 允许tab单步agent执行的每一个hook
  • 举个栗子: 代码编完成后, 执行一个脚本

模型的迭代效益

  • 大模型迭代带来的效益: 不需要精确地prompt

MultiAgent组合: 

  • 前后太的组合
    • 前台: 正在编辑 (local)
    • 后台执行agent 并行运行(云, 长期)
      • 本地的多智能体需要考虑的内容: 
        • 监控不同端口
        • 管理, 调试数据库
        • git: 需要维护多个版本
      • agent之间的竞争

代码的evaluation(cursor的自验证)

  • 要求使用浏览器, 
  • 对dom文件的快照?
  • 对已创建的页面的反馈

未来发展方向: 

人需要完成的任务

  • 系统设计
  • 代码审查

agent

  • 可以理解代码库, 团队风格, 产品理念
  • 提出想法, 帮助探索新方向
  • 将复杂项目分解成可以接受、拒绝、待完善的部分
  • 难题: 提供agent 尝试了的方向, log, 

目前已有的一些工具: 

cursor, codex, claude code(可以支持self-host? todo)

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐