Vibe Coding 的「势」:从自动补全到 Copilot 的技术与职业全景

面向对象:

  • 小白:能看懂行业趋势、基础概念、如何上手
  • 技术大牛:能看到技术演进脉络、架构与能力边界、对个人能力模型的冲击

一、课程核心:什么是「势」,为什么在 AI Coding 时代特别重要?

1. 「势」的定义

文档给出的核心定义可以概括为:

势 = 事物未来发展轨迹的状态

这里区分两种「势」:

  • 行业势
    整个 AI Coding 行业往哪里走、技术怎么演进、有哪些玩家、典型应用场景是什么。
  • 个体势
    在这样的浪潮下,个人要具备什么能力,如何让自己成为「超级个体」,而不是被时代淘汰。

关键思路:先看清「势」,再选择「顺势而为」。


二、课程结构梳理

课程整体可以拆为两大部分(当前课件重点在 Part 1 行业趋势):

  1. 课程预览:5 个核心内容

    • AI Coding 行业发展趋势及玩家分布(行业势)
    • AI Coding 现阶段主流应用场景(行业势)
    • 超级个体需要具备的产品和工程师思维(个体势)
    • 用产品思维拆解一个产品的基础构成(个体势)
    • 用工程师思维理解在新趋势下构建产品的基础原件(个体势)
  2. Part 1:行业趋势拆解(重点)

    • 第一阶段(2015–2020):基于统计的自动补全
    • 第二阶段(2021–2024):生成式 Copilot 时代

三、行业势(1):2015–2020 的「自动补全时代」

这一阶段的关键词:统计、预测下一个词、局部上下文

1. 技术本质:从「大规模代码统计」里学模式

这一阶段的典型思路是:

  • 收集大量开源代码(GitHub 等)
  • 分析出「某一段代码后面通常会跟什么」
  • 根据概率预测你接下来可能想写什么代码

典型模型与技术:

  • 统计模型:N-gram(看前 N 个 token,预测下一个 token)
  • 深度学习早期模型:RNN / LSTM

对小白的类比:
有人看了 10 万篇作文,总结出「我今天去 → 动物园/公园/上学」出现的概率,然后替你猜下一句。

对大牛的要点:

  • 实质是语言模型在代码上的早期应用
  • token 粒度往往是字符/子词/语法单元
  • 长依赖建模能力弱,梯度消失/爆炸问题明显,难以利用长上下文

2. 代表产品与能力边界

代表产品:

  • Kite
  • 早期 Tabnine

能力特征:

  • 能做:
    • 当前行或附近几行的补全
    • 变量名、函数名的自动补完
  • 很难做到:
    • 无法理解整个文件、多个文件间的逻辑
    • 很难一次性生成完整函数或类
    • 几乎不理解「注释里的意图」

总结一句:更像是智能版「代码输入法」,而不是「副驾驶」。


四、行业势(2):2021–2024 的「Copilot 时代」

这一阶段的关键词:Transformer、注意力机制、文件级上下文、生成式

1. 关键里程碑:GitHub Copilot 出场

  • 2021 年:GitHub Copilot 以 VS Code 插件的形式发布预览版
  • 标志着:从「补全下一个 token」→「生成一整段可用代码」
  • 行业概念从「自动补全」升级为「AI 副驾驶(Copilot)」

这不是 UI 的小升级,而是底层架构的代际变化

2. 技术质变:Transformer + 注意力机制

Transformer 的核心:注意力机制(Attention)

它解决的核心问题:

不再线性、一步步地读代码,而是可以同时关注整个上下文中的任何位置

对代码的意义:

  • 能同时关注:
    • 当前函数
    • 文件顶部的 import
    • 同一文件中其他函数
    • 类定义、全局变量
  • 能理解:
    • 函数名及其语义
    • 注释里的意图描述
    • 文件整体结构与模块边界

上下文窗口扩展:

阶段 典型模型 上下文范围 典型能力
统计 / LSTM 阶段 N-gram / LSTM 几十到几百 token 行级补全、简单片段生成
Transformer 阶段 GPT/CodeLLaMA 等 2000+ token 甚至更多 文件级理解、整段代码生成

结果是:

从「你写一句,我帮你接下去」 → 「你说需求,我帮你写完」

3. 能力演进:从「补全」到「协作式编码」

生成式 Copilot 的具体能力包括:

  • 按自然语言/注释描述,生成函数/类/模块
  • 综合文件上下文做重构、补全未实现方法
  • 给已有代码添加测试
  • 理解「这个函数大致在做什么」,并生成解释

行业层面的变化:

  • 编程从「手工敲大部分代码」→「人写意图 + AI写实现 + 人做审查」
  • IDE 插件成为「协作伙伴」,而不是工具栏里的一个小按钮

一句话总结:
第二阶段的 AI Coding,本质是「具备语言理解能力的代码生成模型落地到 IDE」


五、行业势背后的「知识点地图」

  1. 数据基础:大规模公开代码库(GitHub、StackOverflow 等)
  2. 建模方式
    • 阶段 1:N-gram → LSTM/RNN,局部统计 + 短上下文记忆
    • 阶段 2:Transformer,基于自注意力的全局上下文建模
  3. 推理方式
    • 阶段 1:按 token 局部预测,面向当前行
    • 阶段 2:基于「整个文件上下文 + 注释」的条件生成
  4. 产品形态
    • 阶段 1:智能补全插件(Kite、早期 Tabnine)
    • 阶段 2:Copilot 类产品(VS Code 插件等)

六、个体势(1):小白如何顺势而上?

不要再把「会不会写某种语法」当成核心竞争力了

1. 你需要建立的新三观

  1. 行业观

    • 大量重复、模式化的代码会由 AI 生成
    • 人更多转向:理解业务、定义需求、审查与修改 AI 产出
  2. 能力观

    • 你不需要一开始就写出完美代码
    • 但你必须听得懂:
      • 这段 AI 生成代码在干什么
      • 有没有潜在 bug
      • 是否符合业务需求
  3. 学习观

    • 学编程 ≠ 从 0 手写每一行代码
    • 而是:用 AI 快速生成 → 不断理解 → 不断改进

2. 给小白的实用建议(基于本课)

可以直接按这个路径来实践:

  1. 先装一个 AI Coding 工具(如 Copilot 类)
  2. 练习写「清晰注释」
    • 用自然语言描述你希望函数实现的功能
    • 让 AI 根据注释生成代码
  3. 养成审查习惯
    • 每次生成代码后,强迫自己回答三个问题:
      1. 它做了什么?
      2. 可能在哪些边界情况出错?
      3. 有没有更简洁 / 更安全的写法?

你会慢慢从「会用补全」→「会写意图」→「会评估 AI 生成质量」。


七、个体势(2):技术大牛如何重构自己的能力模型?

超级个体需要「产品思维 + 工程师思维」。结合当前内容,可以把它具体化为:

1. 产品思维:用「拆产品」的方式写代码

你需要能做的,不只是写函数,而是:

  • 把一个产品/功能拆成:
    • 目标用户 & 场景
    • 核心流程
    • 关键约束(安全、性能、合规)
  • 用自然语言精确定义:
    • 接口契约(输入输出)
    • 性能与可靠性要求
    • 演进空间(以后可能怎么改)

在 AI Coding 时代,这种能力会直接体现在:

  • 你给 Copilot 的注释/说明有多「结构化、约束清晰」
  • 你能否基于生成的方案作出产品层面的取舍

2. 工程师思维:在「新趋势下」构建产品的基础原件

「基础原件」,在当前阶段可以至少包含:

  • 能被 LLM 正确理解和利用的:
    • 代码结构(模块划分、命名规范)
    • 文档结构(README、API 文档、设计文档)
  • 可供 AI 有效学习的:
    • 统一风格的项目结构
    • 清晰的测试用例(方便 AI 自动扩展)
  • 与 AI 协同的开发流程:
    • 需求 → 自然语言规格 → AI 草稿实现 → 人类审查 → 测试自动化 → 上线

你要从**「我怎么写得更快」,转向「我怎么设计得让人 + AI 一起协作得更好」**。


Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐