💼 求职意向:本人目前正在积极寻找新的工作机会,欢迎各位大佬推荐或内推!🤝
📝 能力简述:详细的技术栈、项目经验及过往履历请见我的 Gitee 简历。同时,我也在持续更新技术博客,希望能通过分享与大家共同进步。
📄 我的简历Gitee 简历链接


大模型行业已经从早期的“百模大战”逐渐走向分层细化,不同岗位的技术壁垒、薪资天花板和职业前景差异巨大。

为了让你更直观地了解这个生态,整理了一份 “难度从极高到低”的岗位全景图,并对核心岗位进行了详细拆解。

🟢AI大模型岗位

🌟岗位全景表

岗位名称 难度 核心技能 市场前景 避坑/注意事项
预训练工程师 极高 分布式训练、底层架构 💎 顶尖(高薪) 需大厂/大算力资源,否则无用武之地
Infra 工程师 极高 C++/Rust、系统底层 💎 顶尖(刚需) 别变成纯运维,要搞架构创新
后训练/基座 RLHF、算法优化 🌟 优秀 避免只做调参或低端标注
应用开发 主流AI框架、Agent、RAG、MCP 🚀 火爆(量大) 别只做API套壳,要做复杂系统
风控/安全 法律法规,LLM原理 🌟 优秀 不要只做“关键词匹配”,要在安全与可用间寻找平稳
模型评估 熟悉主流评测框架,统计学,对数据敏感 🌟 优秀 避免“纯人工打分”,核心在于“工具链”,提高评测效率
数据工程师 中低 SQL、数据清洗 🟢 稳定 别只做体力活,要懂数据质量
Prompt工程师 文案、逻辑思维 🔴 谨慎(红海) 极易被替代,建议作为辅助技能

🏆 岗位难度与价值

在进入详细分析前,通过一个梯队模型来看看这些岗位的江湖地位:

  • 🥇 第一梯队(Hard/High-end): 预训练、Infra —— 硬核技术,薪资天花板
  • 🥈 第二梯队(顶级): 基座优化、后训练、多模态 —— 技术前沿,核心能力打磨
  • 🥉 第三梯队(高): 应用开发 —— 需求量大,商业变现快
  • NPC梯队:(中) 数据、风控、评估 —— 基石岗位,不可或缺
  • 🎣 第五梯队(低 - Low barrier): Prompt Engineer —— 门槛低,易替代

NPC 梯队是指不直接主导模型的核心研发,但却是整个大模型系统能够稳定运行、高质量输出的 “基石”和“背景板


🚀岗位深度分析

1. 预训练工程师 (Pre-training Engineer)

大模型领域的“皇冠明珠”,直接决定了模型的智商上限

  • 岗位难度: ⭐⭐⭐⭐⭐(极高)
    • 通常要求顶尖院校博士,或具备深厚系统与算法功底的资深大佬。
  • 工作内容: 做大模型最核心的事:
    • 设计底层架构,主导大模型训练全流程导基座模型的预训练全流程。
    • 处理海量无标注数据清洗
    • 监控Loss收敛
    • 解决万卡集群训练中的显存溢出(OOM)、通信瓶颈等底层系统级问题。
  • 技能要求:
    • 精通分布式训练框架(如Megatron-DeepSpeed)。
    • 扎实的数学和算法基础,对深度学习原理有极致理解。
  • 市场前景:
    • 薪资处于行业顶端。真正的技术护城河,掌握核心竞争力。
  • 竞争力:
    • 极强。属于 “稀缺资源”,通常集中在头部大厂或独角兽。
  • 避坑指南:
    • 前提条件: 必须加入拥有充足算力和数据资源的团队。如果公司算力不足,你可能只能做做模拟实验,无法积累真正的“炼丹”核心经验,简历含金量会大打折扣。

2. Infra 工程师 (AI Infrastructure)

AI落地的“地基”,没有他们,模型就是跑不起来的废代码。

  • 岗位难度: ⭐⭐⭐⭐⭐(极高)
    • 要求精通底层系统,门槛极高。
  • **工作内容:搞大模型的基础设施,保障训练任务的稳定性、快、省钱
    • 构建和优化训练与推理引擎。
    • 搞定万卡集群的调度与通信优化
    • 开发模型压缩、量化和加速技术
  • 技能要求:
    • 精通 C++/Rust,具备扎实的计算机体系结构、操作系统和分布式系统背景。
    • 熟悉 CUDA、芯片底层逻辑。
  • 市场前景:
    • 随着模型越来越大,对推理成本和速度的要求越来越高,Infra人才是降本增效的关键,需求持续旺盛
  • 竞争力:
    • 技术通用性强,不仅限于AI,系统级能力在任何科技公司都吃香。
  • 避坑指南:
    • 警惕沦为单纯的“底层运维”或“调参侠”。要聚焦于系统架构的创新与性能突破,而不是简单的集群运维。

3.多模态方向 (Multimodal Engineer/Researcher)

目前公认的“下一代风口”,目标是让AI不仅懂文字,还懂图像、视频、音频,实现对世界的综合理解。

  • 岗位难度: (极高)
    • 原因: 典型的“交叉学科”岗位。需要懂NLP(自然语言处理),还得懂CV(计算机视觉)甚至语音处理。技术栈跨度大,对数学功底和算法理解深度要求极高。
  • 工作内容:
    • 研究文本、图像、视频、语音的联合建模。
    • 解决不同模态数据之间的对齐(Alignment)与融合问题(例如:如何让模型理解“图片中未避让行人的车”和文字描述的对应关系)。
    • 开发跨模态检索、图文生成、视频理解等应用。
  • 技能要求:
    • 扎实的深度学习理论基础,精通Transformer架构及其在多模态中的变体。
    • 熟悉主流多模态模型(如BLIP, Whisper, GPT-4V等)。
    • 熟练掌握PyTorch,具备处理大规模多模态数据集的经验。
  • 市场前景:
    • 想象空间巨大。 从“文本理解”走向“世界理解”是必然趋势。无论是具身智能(机器人)、自动驾驶还是创意内容生产,都极度依赖多模态技术。
  • 竞争力:
    • 极高。由于同时具备NLP和CV能力的人才稀缺,这类“全栈型”AI人才在招聘市场上非常抢手,议价能力强。
  • 避坑指南:
    • 切忌“简单拼接”: 不要只做把图像特征和文本特征简单拼在一起的粗暴融合。要追求深度的语义融合和跨模态交互机制的研究。
    • 关注前沿: 这个领域技术迭代极快(如视频生成、3D生成),必须保持对顶会论文(CVPR, ICCV, NeurIPS)的高度敏感。

4. 基座模型优化 & 后训练工程师

如果说预训练是生孩子,后训练(SFT/RLHF)就是教育孩子。

  • 岗位难度: ⭐⭐⭐⭐(高)
    • 需要对深度学习理论和模型架构有深刻理解。
  • 工作内容:
    • 基座优化: 探索新型架构(如MoE、Mamba),优化注意力机制,提升模型在特定领域的推理能力。
    • 后训练: 设计高质量指令微调数据集,实施RLHF流程,训练奖励模型,让模型输出更安全、更符合人类偏好。
  • 技能要求:
    • 懂算法、懂数据、懂工程。
    • 需要熟悉Hugging Face生态、PEFT库等。
  • 市场前景:
    • 处于技术前沿,是让模型从“能用”变“好用”的关键环节。
  • 竞争力:
    • 高。特别是懂RLHF全流程的人才非常抢手。
  • 避坑指南:
    • 避免只做简单的超参数调整(炼丹),或者只做低端的数据标注管理。要深入理解对齐算法的原理Scaling Law

5. 应用开发工程师 (AI Application/Agent)

目前市场需求量最大,也是普通开发者最容易切入的赛道。

  • 岗位难度: ⭐⭐⭐(中等)
    • 更看重工程实践能力、业务理解能力。
  • 工作内容:
    • 基于大模型API或开源模型开发具体产品。
    • 设计Agent的规划与执行逻辑
    • 构建RAG(检索增强生成)系统,将AI能力嵌入实际的业务场景中。
  • 技能要求:
    • 掌握主流AI开发框架,如Spring-AI,熟悉智能体工作流编排流程。
    • 工程实践能力要强
    • 业务理解能力,能将AI赋能到业务系统,和业务系统形成闭环
  • 市场前景:
    • 需求极其旺盛,薪资可观,是AI创造商业价值的直接入口。
  • 竞争力:
    • 快速积累项目经验,是转型AI的“快车道”。
  • 避坑指南:
    • 前提条件: 避免只做简单的API封装(套壳)。要深入理解Agent的工作流编排复杂系统的调试
    • 方向选择: 尽量选择B端降本增效或生产力工具方向,谨慎入坑C端纯聊天助手(生命周期短,竞争红海)。

6. 风控/安全岗 (AI Security & Risk Control):守门神

随着AI监管法规的落地,此岗位已经从“辅助”变成了“一票否决”的关键角色。

  • 岗位难度: (中等)
    • 原因: 难在“对抗性”和“复杂语义理解”。你不仅要懂技术,还得懂法律和人性(恶意攻击)。
  • 工作内容:
    • 内容安全: 设计敏感词库、构建分类器,过滤违法、有害、歧视性内容输出。
    • 对抗防御: 研究Prompt Injection(提示词注入)、越狱(Jailbreak)等攻击手段,开发防御机制。
    • 合规审计: 确保模型训练数据和生成内容符合法律法规,进行隐私数据脱敏处理。
    • 红蓝对抗: 扮演“黑客”角色,主动攻击自家模型以发现漏洞。
  • 技能要求:
    • 熟悉NLP基础技术(文本分类、实体识别)。
    • 了解大模型原理(LLM)及常见攻击面。
    • 熟悉相关法律法规(如数据安全法、个人信息保护法)是加分项。
  • 市场前景:
    • 直线飙升。 监管越来越严,没有安全团队的AI产品根本无法上线。无论是金融、医疗还是通用大模型,都急需此类人才。
  • 竞争力:
    • 稳定且刚需。随着AI应用深入金融、医疗等高风险领域,风控专家的地位会越来越高。
  • 避坑指南:
    • 不要只做“关键词匹配”: 现代风控需要的是基于语义理解的深度检测,单纯的正则表达式和关键词库已经防不住高级攻击了。
    • 平衡体验与安全: 避坑点在于不要为了安全把模型“锁死”导致无法正常使用,要在安全性与可用性之间找到平衡点。
7. 模型评估岗 (Model Evaluator / QA Engineer):质检官
  • 岗位难度: (中等)
    • 原因: 看似门槛不高,但要建立科学、公平、自动化的评测体系非常考验工程能力和逻辑思维。
  • 工作内容:
    • 评测体系建设: 设计评测指标,构建高质量的测试集(Benchmark)。
    • 自动化评测: 开发自动化脚本和工具链,利用GPT-5 或 Qwen 3等强模型对自家弱模型进行打分(Auto-Eval)。
    • 诊断分析: 分析模型的Bad Case(失败案例),定位模型短板(如:数学计算弱、幻觉多),输出给算法团队优化。
    • 竞品对标: 跟踪全球最新模型(如GPT-4o, Claude等),进行横向能力对比。
  • 技能要求:
    • 熟悉主流评测框架
    • 熟练掌握Python数据处理,具备良好的统计学基础。
    • 逻辑严密,对数据敏感,能从海量生成结果中发现规律性问题。
  • 市场前景:
    • 核心支撑。 随着模型能力越来越强,传统的指标已经不够用了,需要更复杂的综合性评测,这个岗位是模型迭代不可或缺的一环。
  • 竞争力:
    • 属于“专家型”岗位。随着经验积累,你对模型能力边界的理解会非常深刻,容易成为团队内的“技术顾问”。
  • 避坑指南:
    • 避免“纯人工打分”: 如果你每天只是在做简单的Excel表格录入和人工阅读打分,那你的职业价值很低,容易被替代。
    • 核心价值在于“工具链”: 要致力于开发自动化、可复用的评测工具和平台,提升评测效率,而不是把自己变成一个“廉价劳动力”。
8. 数据工程师 (大模型方向)

“数据是AI的燃料”,虽然岗位难度不高,但决定了模型的上限。

  • 岗位难度: ⭐⭐(中等偏低)
    • 具备扎实的数据处理技能即可入门。
  • 工作内容:
    • 构建大模型训练所需的数据流水线。
    • 采集、清洗、去重、脱敏海量多源异构数据,并监控数据质量。
  • 技能要求:
    • 熟悉 ETL流程及大数据生态,能对多源异构数据进行采集并治理。
  • 市场前景:
    • 需求稳定,技术栈通用。
  • 竞争力:
    • 门槛相对较低,竞争可能比较激烈。
  • 避坑指南:
    • 避免只做重复性的体力劳动(“洗数据的农民工”)。要关注数据质量对模型效果的影响机制,学会设计高质量的数据集。

9. 提示词工程师 (Prompt Engineer)

目前的“红海”区域。

  • 岗位难度: ⭐(低)
    • 入门门槛低,主要依靠调整提示词来挖掘模型潜力。
  • 市场前景:
    • 需求量大,但天花板低,容易被替代
    • 随着模型能力的增强和自动化工具的出现,单纯的Prompt调优岗位正在逐渐消失或被整合进产品运营中。
  • 建议:
    • 不建议将其作为长期职业目标。如果从事此工作,应尽快向AI产品经理应用开发方向转型。

参考

https://www.bilibili.com/video/BV14JqSBVEGn/

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐