大模型学习与转行复盘:收藏这份转行指南,小白也能轻松入门大模型!
离最后一场面试过去一段时间了,是时候做一个小小的复盘。从4月份开始自学大模型,最开始我连llm是什么都不知道。我的路线是先做定位为大模型应用。每天下班学几个小时。 从4月到11月,基本就是学基础,总结八股,看书,同时保持每天刷2道左右Leetcode。(期间只要有节假日基本都请假去旅游,所有估计有2个月都在玩,不过学习的时候也是有认真学)
离最后一场面试过去一段时间了,是时候做一个小小的复盘。
从4月份开始自学大模型,最开始我连llm是什么都不知道。我的路线是先做定位为大模型应用。每天下班学几个小时。 从4月到11月,基本就是学基础,总结八股,看书,同时保持每天刷2道左右Leetcode。(期间只要有节假日基本都请假去旅游,所有估计有2个月都在玩,不过学习的时候也是有认真学)
10月开始,开始投递简历试水。最开始那几场面试,虽然是应用岗,但是面试官总是时不时问我几句算法内容,弄得我很难受。于是我又在晋级在项目中加上了推理,加速,微调。

好在其实之前都有理论基础,而且我的思路是把算法流程走一遍,不深入学。2月初项目就加入了算法内容,再去面试,技巧和技术都比较成熟了。
今天在这里统一公布的offer。(按时间先后)
京东:算法岗位。面试官说虽然我是应用岗,但是看重我,基本没为难我,问的都是工程问题,算法就是问问我掌握多少,而且当时其实我还没有按照我的补充路线,补一下算法知识,面试技巧应该也不是很完善。但是面试官对我很好,本深一个纯算法岗位,还给的比较多,愿意让我去学,甚至还说可以帮我保留offer一段时间,虽然最后没去,我很感谢面试官。
网龙:算法工程都能做。相对来说小一点公司,算法/应用分的不那么清,面试官说去了想做啥可以选。
SAP:有点偏销售的AI技术岗。感觉啥也没问,全程聊天,没问太多技术。题目都不用做,这样感觉有点是挑背景,看运气的意思了。
夸克千问: 当时想过接offer。目前这个部门是合并到千问C端事业群,大力投入。纯工程岗,因为我的路线学了一些Infra,算法。每次我回答问题的时候,有时会把思路引到Infra,算法上。最后都会被面试官拉回来,说你从工程角度回答。 可能大公司都是这样,分的很清。可以说如果你面这个岗位,可以不学Infra,把工程学到极致就好。
但是后面特别不满意的是,薪资给的太低了。而且他们强度大的一匹。 不断有人和我说他们强度高,甚至无休,单休之类,还有人说1点还在工作。
想起来还是有点生气,这么大的工作强度,给我这么一点工资,涨幅不到20%, 真的瞧不起人。而且纯工程岗,也没意思,后面一点也不想去了。
平安证券:比较常规。中间有个测评。面试内容中规中矩,难度不高。 强度不高,但是开的薪资也中规中矩,去了几乎不涨薪资。
华林证券:4轮技术面,题目也挺难的。相比平安,工作强度大,一天12小时,不过双休。薪资对标互联网。我这时其实求职意向不强了,所以我很坦诚说意想不到,而且要的比较多。40多涨幅了。但也很感谢面试官和HR,他们还是去帮我争取申请了offer。
最后,之前说面试了一个世界500强,被秒了的公司。 是联想。 一面没过。 不过确实感觉面试官特牛,啥都懂,一眼看穿的感觉。
来谈一下转行大模型的一些感受和心得:
1.我还是建议找准定位。你是去应用还是算法。我发现很多人的一个困惑点是,他不知道去算法还是应用,网上很多资料是大模型面经,他根本没写到底是什么岗位。 有的问dpo,有的问Agent。哪些是重点,大家分不清。
但其实应用几乎不会考手撕Attention。道理很简单,应用岗大多是普通开发,不去做深度学习,你对于这样一个背景的群体来说,你去问Attention,确实勉为其难了。 但是如果就是算法岗,深度学习/机器学习是你的核心基础知识,撕一个attention就很常见了。
我的建议是,对于转行大模型的:普通开发(前端,后端,测试) -> 去大模型应用。应用需要工程能力,这是你们做开发具备的,另外我预期大家没有深度学习基础,你要直接转算法,先得去学好深度学习,去训练,我预期这普通开发之前工作有很大差别,门槛较高。我的思路先把应用学好,像我这样目前不愁找不到大模型应用开发的工作量,后面我会再深入学算法。一个是有保底,另外是其实你面算法展示的应用能力也会是你的优势。
算法出身(传统算法) -> 去大模型infra, 算法。 校招生不着急找工作的: 可以双修。
当然现在有趋势是二者能力都需要有。 我的建议是以一条为主,深入学, 加一些算法知识,把流程走过,理论知道,这样问了算法也不会答不上来。这也是我的学习路线。
2.项目可以自己搞定的。 我一直在笔记里思路说我怎么弄得项目,之前笔记里提供思路。 包括你可以参考我最近做的项目,也是准备做完,放简历的,不要嫌弃项目浅,项目浅就一点点加,这个我之前说过。
到时候我用这个项目也去试试水,再和大家说。
学AI大模型的正确顺序,千万不要搞错了
🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!
有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!
就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

如何学习AI大模型?
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
这份完整版的大模型 AI 学习和面试资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;
第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;
第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;
第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;
第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集
👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

更多推荐

所有评论(0)