文章讲述了双非毕业生L同学通过学习AI大模型,从考研考编失败到成功获得25k*13薪offer的经历。分享了学习大模型不需要强数学基础但需掌握核心算法,强调了Python、深度学习、NLP和大模型微调等关键技术点,介绍了面试重点如Agent、RAG和知识图谱等热点方向,并提供了实用的学习方法和面试建议,帮助零基础学员快速入门并成功就业。


L同学,双非一本,2022年大学毕业,考过研,考过编,做过运营,AI大模型二期学员,在元旦前后的年底淡季,基本一天三家面试,最终拿下25k*13薪offer!

学大模型,你有没有这样的困惑:

需要很强的数学基础吗?

算法该掌握到什么程度?

面试找工作的机会多吗?

面试的问题集中在哪些方向?

……

本文通过L同学的亲身经历分享,帮你少走一些弯路。

0****1

那些曲折的过往

来尚硅谷之前,我考过研,考过编,在老家工作过一段时间,都没有取得太好的成绩,究其原因,直白一点说就是:没逼到那个份上。

后来,国企面试表现不佳被刷掉,我想去做前端,当时的想法很简单,学前端快,入了行再慢慢晋升。无奈前端岗位太少,加上当时不会写简历,BOSS上聊了n个HR,发现并非只要我愿意学,能接受低工资,就可以入行。

决定学AI,去了另一家培训机构,只待了4天,发现根本不是一个学习的氛围:很难想象一天只上2小时的课,下午自习没人管,甚至不能上晚自习,7点就要锁门,此处忽略一万字吐槽……

之后,和一个小伙伴一起来到了尚硅谷,我承认,我当时有赌的成分。一是我多年没接触数学了,对算法有些没把握;二是去年初AI落地的东西还比较少,怕学完找不到工作。

还好最后结果不错,我对自己目前的工作很满意,现在很多AI应用在落地。另外,其实数学更多的是作为一种工具存在,并不会特别影响学习和理解。

0****2

在尚大打怪升级

整个学习过程,是一个逐渐对算法以及对编程祛魅的过程。能写编译器的大佬,其实学习的方法也是一步一个脚印的,很多时候,没有像一些数学解析书里写的“易得”、“容易证出”,更多的是要自己真的对程序中每一步都想清楚。

我觉得最好的学习方法是:**当天讲的内容,当天就消化掉。**问题带到第二天会让人很烦躁,当一个个小的点积累起来,就会变成一个大路障。

关于AI工具的使用,刚开始学的时候,不建议大家使用AI工具辅助写代码,前期自己多手写,锻炼内功,后续的1-2个项目可以考虑用AI辅助。

不会的问题,我最开始一直在用豆包,但到了机器学习,豆包对于很多数学方面的解释就容易出现纰漏了,建议还是多和老师交流。

关于代码掌握到什么程度:

后续的项目阶段,在没有老师辅助和尽可能少用AI辅助的情况下,能够独立完成项目,跑通,并且能解释清楚整个代码思路以及难点和细节。

关于实践我的建议:

学大模型微调时,别怕花钱,花几百块多训几个模型绝对非常值得。

重点熟悉服务端操作,了解模型的技术指标:多大的模型、用多少卡训练、数据量多少、参数如何设置、微调你有什么经验、如何避免灾难性遗忘等等。

给大家划划学习的绝对重点:

  • Python:

    GIL锁、并发相关(主要是协程)

  • SQL:

    很重要,尤其是查表,要有基本的查阅能力,以及在代码中写SQL的能力

  • 深度学习阶段:

    梯度下降及其变体,反向传播、优化器、过拟合欠拟合

  • NLP阶段:

    • Attention机制

    • Tokenizer

    - Transformer**(重中之重)**

  • 大模型阶段:

    SFT、PEFT(LoRA/QLoRA)

  • 强化学习阶段:

    PPO/DPO/GRPO

  • 多模态阶段:

    目前面试问的不多,但这是未来的发展方向

  • 目前的行业热点:

    1. Agent:LangChain、Dify、LangGraph、Coze(目前的重点方向,北京十个面试少说有七家要求会智能体

    2. RAG和知识图谱:目前的重点方向,相较来说RAG更重要

  • 数据库方面:

    向量数据库Milvus(企业常用)、缓存数据库Redis

  • 评估指标:

    要重视,我们完成任务就是看代码是否通顺,算法是不是理解,但工作中要汇报,要迭代,对⼀些常见任务要有感觉,比如分类、翻译、RAG系统等的指标,这对面试会非常有帮助

0****3

还算成功的面试

找工作,只要按照尚硅谷的课程走,肯定没问题,只要能够掌握课程的核心内容。至于后续是否能有更好的薪资,就取决于个人的基础和努力了。

我大概总计面了30家左右,如果去掉纯问后端的,通过率能有85%以上,最后拿offer的有10家这样,其他家,有的是自己不想推进了,公司小怕进去太累。其实薪资也可以要更高的,我相对求稳,所以没多要。

真正面下来,有20多家真的需要一个大模型,其中懂大模型的,我印象中只有3-4家,会问到一些比较难和细的点,比如注意力机制的时间复杂度,手推MLP的反向传播。

还有一些会问到关于量化的技术,训练后量化、动态量化,以及一些强化学习相关的,比如大语言模型中的什么对应强化学习的状态和动作,如何做DPO训练,如何构建数据集,如何评估效果,Qwen3的格式长什么样等等。

其他的公司,要么根本不懂,要么问的不深,基本就是八股和项目,而且也就问1-2个项目。算法的话,我面的这些家,只有3家考了算法,所以,这不会是一个卡点。

我之前还担心过自己的学历,一通面试下来没人说这个事,我也只是双非一本,关于学历不用太担心。

总体来说的话,企业还是缺人的,但是很多企业其实也不知道要干什么,目前我在的公司,也是在做一些探索性的工作,我后续的项目应该是Agent相关,微调相关和MCP以及对话助手。

0****4

给小伙伴的建议

这来自于我个人的经验,以及尚硅谷各位老师的建议整合,大家可以根据自己的实际情况,酌情使用,重点说下大家关注的数学和算法吧。

课程中学习用到的数学,还是要尽可能掌握,比如理解梯度下降,一定先理解梯度。关于数学推导的部分,看自己基础,如果努努力能掌握,最好;如果不能掌握,不影响找工作。

建议是先追求深度,广度是深度的副产品,因为大概率是没太多时间系统看完的。数学作为大家的内功,不是整个学习期间的重点,但是未来可能会在工作中学习一些前沿的算法,看⼀些论文有⼀个好的基础,才更容易理解。

如果一个数学知识不懂,可以尝试问AI,举例:“我现在要理解KL散度,请从一个高中毕业生的基础来逐步讲解,从我的知识层面如何过渡到KL散度,把中间所有的知识点帮我捋清楚。”

在这个过程中,自然会学到信息量、熵等一系列的概念。

关于算法,⼀定要先理解时间复杂度和空间复杂度,重点掌握简单题和中难度题,困难题重点看思路。

出难题的情况大概有两种:

一是大厂;二是面试官不太满意,上一道算法题,你能做出来再考虑下,做不出来就直接送你离开了。

对算法祛魅,不要怀疑自己的智力,一开始难是正常的,见多了就会了。

如果对于⼀个算法理解不够深刻,就把它的执行过程一点点画出来,比如理解递归,自己画⼀下,抽象思维是通过⼀次次的具象过程锻炼出来的。

如果⼀个算法题30分钟没思路,可以考虑直接看实现。30分钟内有思路就先自己写,⼀次写出来最优算法还是很难的,能解决问题就可以,逐步优化,在优化的过程中,加深对算法的理解,做完记得总结思路。

算法掌握到什么程度?对于你刷过的算法,想象你同桌是面试官,你可以给他说清楚思路。比如面试官问爬楼梯的思路是什么?你能说出来算法的思路,以及能够说出来重点的细节,最好能在图上也画出来,大部分面试就够用了。

如何学习AI大模型?

如果你对AI大模型入门感兴趣,那么你需要的话可以点击这里大模型重磅福利:入门进阶全套104G学习资源包免费分享!

这份完整版的大模型 AI 学习和面试资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

在这里插入图片描述

这是一份大模型从零基础到进阶的学习路线大纲全览,小伙伴们记得点个收藏!

请添加图片描述
第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

100套AI大模型商业化落地方案

请添加图片描述

大模型全套视频教程

请添加图片描述

200本大模型PDF书籍

请添加图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

LLM面试题合集

请添加图片描述

大模型产品经理资源合集

请添加图片描述

大模型项目实战合集

请添加图片描述

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

在这里插入图片描述

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐