揭秘字节大模型实习生生活:真实体验与成长故事
本文作者分享在字节跳动实习大模型项目的宝贵经历,详细描述了在大厂环境中学习AI前沿技术、参与实际项目开发的全过程。文章对比了学术界与工业界的差异,探讨了AI4SE方向的发展前景,并对个人职业规划进行了深入思考。作者通过实例展示了如何将理论知识转化为实际能力,为想进入大模型领域的学习者提供了宝贵的实战经验和职业发展建议。
时间飞逝啊,站在 26 年回望去年的自己,当时估计完全想不到现在的情况吧。
这一年主要是两个大的变化:
- 一是找到了比较喜欢的方向,也在这个方向上做了一些工作;
- 二是实习了几乎一整年,对业界有了非常多之前难以想象的了解。
书接暑期总结,处理完学校的事情之后,开始了我第一次在大厂的实习经历,入职字节
在前一个半月的时候,对大厂的一切都还处于一个非常新奇的状态,像海绵一样汲取着各种文档和其他同事见解的知识。
字节的一个半月是飞速成长的一个半月, 大厂的各种东西确实和外界有很大不同,强烈建议所有同学至少去大厂实习一段,无论是学术、工程还是想躺平我觉得都是大有裨益的。
刚入职的时候,日记上是这么写的:
先说结论:字节跳动对策性极强,泛用性极强,属于超大杯上,主包感觉第一天就要变成节孝子了,之前过的什么苦日子啊。
电脑是 m3pro 32+512;食堂是免费的,挺好吃的感觉大于学校;咖啡机刚上新,味道不错;mt 人也很好,我直接没什么业务要做叫我多学学看看文档和 paper;
文档都可以看,技术栈深得很,吃饭就是听 mt 三个算法老 ass 讲设计拆方案,聊到自己的什么想法就能甩出几篇相关文档看。今天和 mt 讨论了一个多小时算法,真的爽聊了。
对字节印象最深的就是 bytetech 和组内不间断的交流,当你的周围全是老算法工程师和顶尖 Phd 的时候,光是看他们每天在做什么、如何分析一个问题都能学到相当多的东西。
更何况大家还是一起在研究一个共同的方向,能吃到一大堆业内的动态和最新最热研究成果。
有人带着你拆 openai/anthoropic 的布局设计,有人能讲我之前就在阿里和微软工作,你看的这篇就是我们组之前干的,有人能写出来质量大于外场综述的技术文档、机器人给你推送不同组横跨多个领域的顶尖工作……
如果有技术热情的话,你很难不被这种工作氛围深深吸引,“我们正在改变世界”。
曾经有一个同学和我说“你永远可以相信字节 ld 的技术 insight”,确实如此,进来实习之后比起具体技术的提升,自觉收获更大的是对技术的一种嗅觉。
在 ai 如此火热的当下,每年 arxiv 能产出几万甚至十几万篇文章,然而纷繁芜杂的论文背后,究竟哪些是值得 follow 的技术方向,哪些受限于资源难以做成,哪些是局部的优解但几个月后就会失去价值,又是哪些是 rubbish paper?
这些藏在学校头部实验室的 top phd/教授的脑子里面的信息,在大厂里却能海量接触到:在厂里面你们是同事,随时询问,热心解答;
厂外大家来自五湖四海,各自都在领域内有所建树,或许在学术会议上 social 半天还未必 social 得到…
agent memory 的落地,context 的管理,搜索技术的边界,强化学习的落地,曾经不解的、质疑的、萌芽的想法在这里都得到了或阶段性或实验形式的答案。
在和 mentor 提出一个设想的时候,被回答一句“你说的这个很有意思,之前豆包做过一个类似的东西,我给你看看文档了解一下他们怎么做的”,怎不会有一种和他人共鸣的强烈爽感?
甚至有一次看到了某篇论文,感觉似乎挺有趣,一看 trae 组做的,就和那边约了一个 meeting 讨论,这种交流的感觉相当好。
除却技术眼界上的进步,字节给我带来的还有大厂生活的一窥:完善的基础设施建设、加班与赶工需求、组间的“小心机”、休息时对其他产品的吐槽……
带来了一种小团队不会有的“真实感”,工业级需求到底是什么,技术方案设计究竟是什么样子,互联网是一种怎样的行业,字节给了一种近乎野蛮生长的体验,正如友人的评价。
自己觉得现在正走在对的路上就会越走越轻松,主包现在就是步入正轨了所以越干越年轻
学术界主要承担的还是探索的作用,但是到底哪些想法能够落地?这种敏感性不在企业是锻炼不出来的,对需求判别和可行性判别做了强化学习说是。
另一个感觉值得一提的是某个小红书的 AMA。
Q:课题组没卡,怎么做大模型?
A:如果卡少,就做 inference 加速,不怎么吃资源;如果有钱,就做 Agent;啥都没有建议躺平。
说的是真没错,如果实验室两个都不能满足的话,还是积极出去找工吧。
在 llm 这种 scale up 的场景,没卡真的是没得做,按照现在的情况来说,大部分实验室连跑个小训练或者调 api 做原型验证的财力都没有。校企合作是对的,不放正常企业的老师是有问题的。
如友人评述:企业的资源太丰富了,包括软性的各种交流、文档和硬性的软硬件,真没得比。
在后一个半月的时候,看文档的时间相对变少了,主要原因是在做一篇 llm coding 相关的 paper,从 10 月份和学长讨论决定做做试试,再到 11 月训练出来模型 work,然后再是适用范围的放广,下游实验的不断加多,迭代训练和数据……
一个非常幸运的是实习也恰好在遇到了对应的问题,然后伟大的 mentor 和+1 大手一挥给了自由时间可以上班做这篇 paper(相当于校企合作),于是也是在月初以一作投出去了。
说起这篇 paper 还有一个很有趣的事情,书接上文在暑假的时候对代码补全起了一些兴趣,然后小红书给我推了一个招科研实习的。
练习了一下发现居然是本院的博士(笑)还有找回自家来这么有趣的事情,经过一些 paper reading 和交流之后也是做起了 RA,并且一起做了两篇 paper,也建立了比较长期的合作关系……
在实习的这段时间和做科研的时间里面,感觉也算是找到了一个相当感兴趣的方向,即代码大模型,或者更广义一些是 ai4se。
一个原因是感觉这个方向处在一个微妙的ai和系统工程的叠加态,算是走回舒适圈;二是它在工业上的应用真的相当广泛,也是现在 ai 最能落地和解放生产力的方向之一,让所有人都能通过代码进行创造是一个相当 promising 的愿景。
除此之外好像就是正常上班,做一些业务需求,和前辈讨论一下新的 idea 和最佳实践。
还有就是迷上了打乌蒙,也是在期末周上了 w4 了 wwwww,正如某个群聊里面的给自己起的群昵称,上班磕盐舞萌 ing。感觉就是一个正反馈循环,作息极其阴间的同时还挺享受的。
在上班下班的时间里面也和不少人聊天,再次仔细地想了想未来的一些规划,感觉现在一是继续深造不一定能吃到这一波大模型红利了,其实很赌;二是观察了几个做 ai4se 的组,感觉组内的去向最后也就是大厂相关方向实习;
三是总体来看,厂里面做这个在资源、选题和成果的质量上都感觉远超学界,感觉学界相当多工作真没啥意义。
倒是也想过去港新读一年硕,但经济开销和一些互联网里面对于硕士的观点好像也感觉没太多必要,感觉本科能找到的话硕士学历似乎好像没啥用,可能真想要的是一些休息的时间或者说眼界上的开拓。
但国外情况越来越差、国内硕士的最好情况又是纯放养变成实习仙人——那倒是还不如早点上班,说不定不用做横向还更 wlb 一点。
还有一个体验是基模组的作息和出差,感觉真的很累,之前和同事聊也有类似的感受,真的一定要卷基础模型吗(我承认确实有一些美化滤镜)?
还是说做一些更业务的算法方向比如偏 agent、搜索之类的,但有机会还是想要体验一下。
虽然我看我知道的大部分基础模型的老哥的工作也就是洗数据然后给 infra 搭好的训练基架提任务(笑),真能做模型架构创新的还是蛮少的,并且产出相当不稳定。
至于本学期的校内课,确实丢到犄角旮旯里面去了(心虚),成绩估计是烂完,基本就是不挂科吧。说实话我感觉这些课对我的未来规划没啥用。
除此之外产出了一些公共的贡献吧!在校内论坛发了不少精品技术帖,包括 bytetech 也搬运了一些 www,给学弟学妹也提供了不少建议,感觉还是体验很好的。
之后就是寒假!希望我能稍微干点活 www,前面其实积攒了不少 idea,也有挺多社区的新 paper 也可以看,看看还能不能在秋招之前再产出一些成果吧,相信道路是曲折的,前途是光明的。
说真的,这两年看着身边一个个搞Java、C++、前端、数据、架构的开始卷大模型,挺唏嘘的。大家最开始都是写接口、搞Spring Boot、连数据库、配Redis,稳稳当当过日子。
结果GPT、DeepSeek火了之后,整条线上的人都开始有点慌了,大家都在想:“我是不是要学大模型,不然这饭碗还能保多久?”
我先给出最直接的答案:一定要把现有的技术和大模型结合起来,而不是抛弃你们现有技术!掌握AI能力的Java工程师比纯Java岗要吃香的多。
即使现在裁员、降薪、团队解散的比比皆是……但后续的趋势一定是AI应用落地!大模型方向才是实现职业升级、提升薪资待遇的绝佳机遇!
这绝非空谈。数据说话
2025年的最后一个月,脉脉高聘发布了《2025年度人才迁徙报告》,披露了2025年前10个月的招聘市场现状。
AI领域的人才需求呈现出极为迫切的“井喷”态势

2025年前10个月,新发AI岗位量同比增长543%,9月单月同比增幅超11倍。同时,在薪资方面,AI领域也显著领先。其中,月薪排名前20的高薪岗位平均月薪均超过6万元,而这些席位大部分被AI研发岗占据。
与此相对应,市场为AI人才支付了显著的溢价:算法工程师中,专攻AIGC方向的岗位平均薪资较普通算法工程师高出近18%;产品经理岗位中,AI方向的产品经理薪资也领先约20%。
当你意识到“技术+AI”是个人突围的最佳路径时,整个就业市场的数据也印证了同一个事实:AI大模型正成为高薪机会的最大源头。
最后
我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。
我整理出这套 AI 大模型突围资料包【允许白嫖】:
-
✅从入门到精通的全套视频教程
-
✅AI大模型学习路线图(0基础到项目实战仅需90天)
-
✅大模型书籍与技术文档PDF
-
✅各大厂大模型面试题目详解
-
✅640套AI大模型报告合集
-
✅大模型入门实战训练
这份完整版的大模型 AI 学习和面试资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

①从入门到精通的全套视频教程
包含提示词工程、RAG、Agent等技术点

② AI大模型学习路线图(0基础到项目实战仅需90天)
全过程AI大模型学习路线

③学习电子书籍和技术文档
市面上的大模型书籍确实太多了,这些是我精选出来的

④各大厂大模型面试题目详解

⑤640套AI大模型报告合集

⑥大模型入门实战训练

👉获取方式:
有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

更多推荐


所有评论(0)