想进大厂搞AI？大模型面试秘籍：20家AI大厂面试经验全揭秘，助你一臂之力！

本文分享了作者在淘天、字节AML和商汤三家公司的面试经历及获得的offer情况。淘天未来生活实验室主要聚焦大模型在搜广推和内容化场景的应用，面试涉及OCR训练、实验设置等技术问题；字节AML注重多模态大模型和算法基础，考察了哈希表设计、交叉熵计算等题目；商汤则关注视觉与多模态结合的应用场景。作者最终选择加入淘天，认为其面试体验较好且阿里文化氛围相对温和。三家公司都围绕大模型技术展开深入的技术探讨和

Cc不爱吃洋葱

882人浏览 · 2025-12-27 09:00:00

Cc不爱吃洋葱 · 2025-12-27 09:00:00 发布

面经：

1、淘天【offer】：

部门：未来生活实验室。

介绍：

淘天集团的大模型研究将主要围绕两个场景展开：一是搜广推，二是逛逛的内容化。团队组建工作由淘天集团CEO戴珊、淘天集团CTO若海、阿里妈妈CTO郑波等人共同牵头。

面经：

一面：

如何训练ocr任务
实验的setting，
ocr任务影响如何
高分辨率训练，再在小分辨率上，会不会崩掉
输出bbox有没有好的方式

HR面：

基本信息确认：
考研进入电子科技大，为什么
为什么进入了诺亚
代表性的工作
如何解决问题的，国内在做语言大模型的多一些。
国内在做多模态大模型的
如何评测，评估这些大模型的。如何看待刷榜的问题。
你们的衡量指标

面试体验：

面试体验很好。HR也没有那么咄咄逼人。阿里味不是特别明显。最终权衡也选择来了淘天，）。

2、字节AML【offer】：

部门：AML火山方舟大模型

介绍：

预备面经：

猎头也提供了一些其他候选人的面经，整理如下：

设计一个Hash表
蓄水池问题
从超大文本文件中随机行采样
二叉搜索树-去掉超出[m, n]范围内的节点
计算交叉熵
计算IOU

一面：

多模态你们的流程
你们的OCR的结构
layernorm的区别

二面：

什么时间开始做多模态模型
目前在文档
Token长度太大。高分辨率如何解决。
patch能不能变得
VQGAN
GPT4V的结构形式。
LLM decoder
MagViT
LLM的基础知识需要尽快补上

三面：

自我介绍
多模态大模型用哪个模型
Transformer比较熟悉
python实现self attention和Transformer

面试体验：

字节一如既往的注重coding，基本每一面两道题，自己能拿到offer也算是运气吧。一面的面试体验很差，可以说是毫无面试经验的面试官。

3、商汤【offer】：

一面：

简单的自我介绍
关于高分辨率的解决办法
OCR是如何去做的，有没有grounding，Referring。
GPT4V 位置，检测明显的问题。
你们是如何解决位置信息的。
新的模态，进来。如何去拼接过来。
新来一批数据，如何训练。
tree1是否是tree2的子树。

二面：

AGI缺不了视觉。
工业场景，人的检测，奇怪的零件，机器的检测。检测的结果，需要理解人的行为。理解和context的关系。人和环境的关系。借助多模态来解决。
自驾，感知端，到决策端，感知不需要全面的感知，着重额感知需要。
假新闻，图是真的。caption场景。
OCR，街景的OCR，文档，网页截图等是不同的，这些场景混在一起。会有影响吗。
OCR的方案，一般是先出检测框，再出文本。不规则的文本，如何解决。
多模态大模型的OCR。
Qwen-VL的文本检测形似，是否合理。
模型本身的三种能力：
自己的能力，认识什么。
LISA：借助decoder来做，用新的prompt来实现分割。
外挂RAG等。
判断左右括号（），等组成的字符串是否是合法的。

二面结束，问题不大。

三面：

Leader面，聊了一些有的没的

面试体验：

面试过程很专业，毕竟是商汤，算法技术是国内领先的，奈何没产品，而且薪资包也没有诚意。

4、蚂蚁风控大模型【offer】：

一面：

自我介绍
介绍Focus-DETR，有没有在业务中应用。

二面：

介绍
目前在做的事情
下游的任务，文档场景，再做一个什么任务。
ocr数据是如何生成的。
效果如何。
如何解决幻觉的问题。

HR面。

具体的工作内容，印象
安全内容，tob的内容审核。竞对。
个人介绍。
上海海思，为什么跳槽
算法支撑

这份完整版的大模型 AI 学习和面试资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

在这里插入图片描述

5、MiniMax：【挂】

一面：

空间感知能力是如何解决的
不同token长度是否有做balance的方式
很多有价值的问题。
python实现标题 MLP Regressor 题目描述题目描述与要求:实现一个MLP regressor 的完整训练过程，包括:forward , backward , SGD更新参数;验证backward梯度正确性;构建数据，验证端到端正确性 (收敛&泛化);(optional) 参考你过往的实验经验，尽可能让功能更完善;不使用第三方库中已实现好的自动求导方法;

P.S. 实现方法不限，但由于在线IDE运行环境不稳定，推荐使用numpy。