关注我,定期发布互联网大厂面试经验!
【一面】
- 自我介绍
- 介绍之前的实习经历
- 实习所用的模型, 用户侧特征是怎么得到的.
- 淘宝EGES的原理.
- 如何增量训练, 如何在保持嵌入矩阵维度不变的情况下增量训练(可能会有新书进来)
- 多任务模型的一般思路.
- 为何选择DIN为排序模型.
- 结合实习的业务, 对比DIN和BST的效果.
- AB test的原理
- AB test中你会关注哪些信息
- 实习时间
- 反问环节(我问了 部门的工作内容, 转正率什么的)
- 算法题: 简单题, 二叉树, 每个节点有一个值, 求出二叉树从根出发的所有路径的和.总体来说, 一面考核的是思想层面, 比如考核面对大数据如何增量训练, 面对多指标如何多任务学习, 从离线实验到部署上线的流程, 线上测试需要关注的信息, 模型选择的依据等.
【二面】
- 自我介绍
- 介绍我的CV比赛项目
- 介绍Cascade cnn框架的优势.
- 介绍比赛中的有用的trick有哪些
- yolo的损失函数
- 介绍所了解的目标检测框架.
- 实习经历
- 分别介绍所了解的推荐模型有哪些.
- 是否了解L2R, NLP, transformer, 图神经网络.10. 推导FM的时间复杂度优化公式(n方复杂度优化到n复杂度)
- 有哪些 所了解的机器学习算法
- 算法题: 中等题, 编辑距离(增删改的惩罚由参数指定)二面考核的主要是宽度, 几乎都是横向的问, 很少纵向的深挖, 而我恰恰缺乏宽度的积累, 所以面试过程还是有点难受.
最后的算法题, 编辑距离是将A变成B需要的操作数, 我头脑发热, 理解成了把A和B变成一样所需4要的操作数, 最后导致dp的转移方程写的有点问题, 而且自己测试怎么都感觉是对的.
【三面】
- 自我介绍
- 介绍实习经历.
- EGES算法如何建图
- 图的边如何表示成概率.
- 图的边表示的概率如何运用到后续的训练中.(我一开始理解错了意思, 以为问的是边权计算概率的方式对模型的影响)
- 如何将多种商品特征结合起来, 用EGES训练得到多个特征的嵌入向量.
- skipgram和cbow的区别, 为什么选择skip gram.
- skip gram和cbow的模型结构(详细到几乎口述代码的程度)
- 选择skipgram的输入向量还是输出向量作为商品的嵌入表示.
- 如何验证向量召回算法生成embedding的质量.
- DIN的模型结构, DICE原理
- 为什么选择DIN
- 线上AB测试中DIN的表现和别的模型对比, 以及原因.
- DIN的缺点
- 如何将文本信息融入到推荐系统中.
- 是否了解NLP, 介绍transformer的原理
- 多任务的主要解决方案
- 算法题: 中等题, 一个矩阵, 从左上角走到右下角, 只能往下,往右,往右下走, 求路径和最小的所有路径.三面面试官的考核主要是深度, 一直深挖每一个细节, 基本上问到口述代码的程度.不过所有代码都是自己写的就问题不大.
【HR面】
- 自我介绍
- 实验室介绍
- cv转推荐的原因
- 读研选择cv的原因
- 保研 or 考研
- 实习完 工作还是读博
- 入职时间
- 实习经历和收获