从双非到25k*13薪：零基础学大模型的完整指南与面试经验

双非毕业生L同学通过系统学习AI大模型技术，在考研考编失败后成功转型，最终斩获25k*13薪offer。文章揭秘了学习AI大模型的核心要点：无需强数学基础但要掌握Python、深度学习、NLP及大模型微调等关键技术，重点介绍了Agent、RAG等面试热点方向。L同学分享了"当日消化知识"的学习方法，强调实践微调项目的重要性，并指出当前企业对大模型人才的需求旺盛，学历并非主要门槛

python零基础入门小白

438人浏览 · 2026-02-03 22:37:17

python零基础入门小白 · 2026-02-03 22:37:17 发布

文章讲述了双非毕业生L同学通过学习AI大模型，从考研考编失败到成功获得25k*13薪offer的经历。分享了学习大模型不需要强数学基础但需掌握核心算法，强调了Python、深度学习、NLP和大模型微调等关键技术点，介绍了面试重点如Agent、RAG和知识图谱等热点方向，并提供了实用的学习方法和面试建议，帮助零基础学员快速入门并成功就业。

L同学，双非一本，2022年大学毕业，考过研，考过编，做过运营，AI大模型二期学员，在元旦前后的年底淡季，基本一天三家面试，最终拿下25k*13薪offer！

学大模型，你有没有这样的困惑：

需要很强的数学基础吗？

算法该掌握到什么程度？

面试找工作的机会多吗？

面试的问题集中在哪些方向？

……

本文通过L同学的亲身经历分享，帮你少走一些弯路。

0****1

那些曲折的过往

来尚硅谷之前，我考过研，考过编，在老家工作过一段时间，都没有取得太好的成绩，究其原因，直白一点说就是：没逼到那个份上。

后来，国企面试表现不佳被刷掉，我想去做前端，当时的想法很简单，学前端快，入了行再慢慢晋升。无奈前端岗位太少，加上当时不会写简历，BOSS上聊了n个HR，发现并非只要我愿意学，能接受低工资，就可以入行。

决定学AI，去了另一家培训机构，只待了4天，发现根本不是一个学习的氛围：很难想象一天只上2小时的课，下午自习没人管，甚至不能上晚自习，7点就要锁门，此处忽略一万字吐槽……

之后，和一个小伙伴一起来到了尚硅谷，我承认，我当时有赌的成分。一是我多年没接触数学了，对算法有些没把握；二是去年初AI落地的东西还比较少，怕学完找不到工作。

还好最后结果不错，我对自己目前的工作很满意，现在很多AI应用在落地。另外，其实数学更多的是作为一种工具存在，并不会特别影响学习和理解。

0****2

在尚大打怪升级

整个学习过程，是一个逐渐对算法以及对编程祛魅的过程。能写编译器的大佬，其实学习的方法也是一步一个脚印的，很多时候，没有像一些数学解析书里写的“易得”、“容易证出”，更多的是要自己真的对程序中每一步都想清楚。

我觉得最好的学习方法是：**当天讲的内容，当天就消化掉。**问题带到第二天会让人很烦躁，当一个个小的点积累起来，就会变成一个大路障。

关于AI工具的使用，刚开始学的时候，不建议大家使用AI工具辅助写代码，前期自己多手写，锻炼内功，后续的1-2个项目可以考虑用AI辅助。

不会的问题，我最开始一直在用豆包，但到了机器学习，豆包对于很多数学方面的解释就容易出现纰漏了，建议还是多和老师交流。

关于代码掌握到什么程度：

后续的项目阶段，在没有老师辅助和尽可能少用AI辅助的情况下，能够独立完成项目，跑通，并且能解释清楚整个代码思路以及难点和细节。

关于实践我的建议：

学大模型微调时，别怕花钱，花几百块多训几个模型绝对非常值得。

重点熟悉服务端操作，了解模型的技术指标：多大的模型、用多少卡训练、数据量多少、参数如何设置、微调你有什么经验、如何避免灾难性遗忘等等。

给大家划划学习的绝对重点：

Python：

GIL锁、并发相关（主要是协程）
SQL：

很重要，尤其是查表，要有基本的查阅能力，以及在代码中写SQL的能力
深度学习阶段：

梯度下降及其变体，反向传播、优化器、过拟合欠拟合
NLP阶段：
- Attention机制
- Tokenizer
- Transformer**（重中之重）**
大模型阶段：

SFT、PEFT（LoRA/QLoRA）
强化学习阶段：

PPO/DPO/GRPO
多模态阶段：

目前面试问的不多，但这是未来的发展方向
目前的行业热点：
1. Agent：LangChain、Dify、LangGraph、Coze（目前的重点方向，北京十个面试少说有七家要求会智能体）
2. RAG和知识图谱：目前的重点方向，相较来说RAG更重要
数据库方面：

向量数据库Milvus（企业常用）、缓存数据库Redis
评估指标：

要重视，我们完成任务就是看代码是否通顺，算法是不是理解，但工作中要汇报，要迭代，对⼀些常见任务要有感觉，比如分类、翻译、RAG系统等的指标，这对面试会非常有帮助

0****3

还算成功的面试

找工作，只要按照尚硅谷的课程走，肯定没问题，只要能够掌握课程的核心内容。至于后续是否能有更好的薪资，就取决于个人的基础和努力了。

我大概总计面了30家左右，如果去掉纯问后端的，通过率能有85%以上，最后拿offer的有10家这样，其他家，有的是自己不想推进了，公司小怕进去太累。其实薪资也可以要更高的，我相对求稳，所以没多要。

真正面下来，有20多家真的需要一个大模型，其中懂大模型的，我印象中只有3-4家，会问到一些比较难和细的点，比如注意力机制的时间复杂度，手推MLP的反向传播。

还有一些会问到关于量化的技术，训练后量化、动态量化，以及一些强化学习相关的，比如大语言模型中的什么对应强化学习的状态和动作，如何做DPO训练，如何构建数据集，如何评估效果，Qwen3的格式长什么样等等。

其他的公司，要么根本不懂，要么问的不深，基本就是八股和项目，而且也就问1-2个项目。算法的话，我面的这些家，只有3家考了算法，所以，这不会是一个卡点。

我之前还担心过自己的学历，一通面试下来没人说这个事，我也只是双非一本，关于学历不用太担心。

总体来说的话，企业还是缺人的，但是很多企业其实也不知道要干什么，目前我在的公司，也是在做一些探索性的工作，我后续的项目应该是Agent相关，微调相关和MCP以及对话助手。

0****4

给小伙伴的建议

这来自于我个人的经验，以及尚硅谷各位老师的建议整合，大家可以根据自己的实际情况，酌情使用，重点说下大家关注的数学和算法吧。

课程中学习用到的数学，还是要尽可能掌握，比如理解梯度下降，一定先理解梯度。关于数学推导的部分，看自己基础，如果努努力能掌握，最好；如果不能掌握，不影响找工作。

建议是先追求深度，广度是深度的副产品，因为大概率是没太多时间系统看完的。数学作为大家的内功，不是整个学习期间的重点，但是未来可能会在工作中学习一些前沿的算法，看⼀些论文有⼀个好的基础，才更容易理解。

如果一个数学知识不懂，可以尝试问AI，举例：“我现在要理解KL散度，请从一个高中毕业生的基础来逐步讲解，从我的知识层面如何过渡到KL散度，把中间所有的知识点帮我捋清楚。”

在这个过程中，自然会学到信息量、熵等一系列的概念。

关于算法，⼀定要先理解时间复杂度和空间复杂度，重点掌握简单题和中难度题，困难题重点看思路。

出难题的情况大概有两种：

一是大厂；二是面试官不太满意，上一道算法题，你能做出来再考虑下，做不出来就直接送你离开了。

对算法祛魅，不要怀疑自己的智力，一开始难是正常的，见多了就会了。

如果对于⼀个算法理解不够深刻，就把它的执行过程一点点画出来，比如理解递归，自己画⼀下，抽象思维是通过⼀次次的具象过程锻炼出来的。

如果⼀个算法题30分钟没思路，可以考虑直接看实现。30分钟内有思路就先自己写，⼀次写出来最优算法还是很难的，能解决问题就可以，逐步优化，在优化的过程中，加深对算法的理解，做完记得总结思路。

算法掌握到什么程度？对于你刷过的算法，想象你同桌是面试官，你可以给他说清楚思路。比如面试官问爬楼梯的思路是什么？你能说出来算法的思路，以及能够说出来重点的细节，最好能在图上也画出来，大部分面试就够用了。

如何学习AI大模型？

如果你对AI大模型入门感兴趣，那么你需要的话可以点击这里大模型重磅福利：入门进阶全套104G学习资源包免费分享！

这份完整版的大模型 AI 学习和面试资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

在这里插入图片描述

这是一份大模型从零基础到进阶的学习路线大纲全览，小伙伴们记得点个收藏！

请添加图片描述
第一阶段： 从大模型系统设计入手，讲解大模型的主要方法；

第二阶段： 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用；

第三阶段： 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统；

第四阶段： 大模型知识库应用开发以LangChain框架为例，构建物流行业咨询智能问答系统；

第五阶段： 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型；

第六阶段： 以SD多模态大模型为主，搭建了文生图小程序案例；

第七阶段： 以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

100套AI大模型商业化落地方案

请添加图片描述

大模型全套视频教程

请添加图片描述

200本大模型PDF书籍

请添加图片描述

👉学会后的收获：👈

• 基于大模型全栈工程实现（前端、后端、产品经理、设计、数据分析等），通过这门课可获得不同能力；

• 能够利用大模型解决相关实际项目需求：大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。因此，掌握大模型应用开发技能，可以让程序员更好地应对实际项目需求；

• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能，学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；

• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力：大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。

LLM面试题合集

请添加图片描述

大模型产品经理资源合集

请添加图片描述

大模型项目实战合集

请添加图片描述

👉获取方式：
😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

在这里插入图片描述

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

从RNN到LSTM：循环神经网络的进化之路

其实回顾两张图片的结构差异，就能明白循环神经网络的进化逻辑：RNN解决了“神经网络能否有记忆”的问题，而LSTM解决了“如何让记忆更持久、更精准”的问题。对于我们AI应用开发工程师来说，理解它们的原理，不仅能帮我们在项目中快速选对模型（比如短文本用RNN省资源，长文本用LSTM保效果），更能为后续学习GRU（LSTM的简化版）、Transformer（当前NLP的主流模型）打下基础——毕竟，所有复

2048 AI社区

DeepSeek一体机部署：中小企业本地化算力成本控制方案

2048 AI社区

构建具有多目标优化能力的AI Agent

随着人工智能技术的不断发展，单一目标的AI Agent已经难以满足复杂现实场景的需求。构建具有多目标优化能力的AI Agent成为了当前研究的热点。本文章的目的在于系统地介绍如何构建这样的AI Agent，包括其核心概念、算法原理、数学模型以及实际应用等方面。范围涵盖了从理论基础到项目实战的全过程，旨在帮助读者全面掌握构建具有多目标优化能力的AI Agent的方法和技术。本文将按照以下结构进行组织