【一面】
1.算法题:leetcode 排序矩阵查找,leetcode 102 二叉树的层序遍历
2.介绍一个你认为做的最好的比赛
3.ANN用的什么工具?介绍一下原理
4.为什么选择Annoy?
5.还知道其他ANN算法吗?介绍了一下局部敏感hash
6.做用户商品交互特征的时候,你知道业界是怎么做的?扯了一下DIN
7.模型的和目标商品的attention做法
8.lightgbm和xgboost的区别
9.排序阶段你知道业界是怎么做的?说了一下点击率模型:deepfm,nfm,wide & deep,dcn,deepcrossing
10.介绍一下word2vec
11.介绍一下transformer
12.bert的两种预训练方式
13.为什么要用mask?说了padding mask和sequence mask
14.为什么要sequence mask?防止信息穿越
【二面】
1.算法题:求从左上角到右下角的最小开销。给定一个二维数组arr[i][j],数组中每个点表示经过该点的开销,求从左上角为起点,右下角为终点的最小开销,在每个点时只能往右或者往下走,同时中途可能会有障碍,即有些点不能走,obs[i][j]=1时表示(i, j)不能走。dp和dp状态压缩。
2.介绍一个比赛
3.ANN用的什么工具,介绍一下原理
4.如何提高冷门商品的推荐效果的?
5.了不了解大数据框架?
6.说一下你熟悉的linux命令
7.一个文件每行一个数字,用命令统计所有数的平均值和数字个数
8.逻辑回归损失函数和求导
9.介绍一下你了解的优化器和各自的优缺点
10.Adam和Adagrad的区别
【三面】
1.算法题:有一个长度为n的数组,求一个数k,k的取值区间为[1, n-1],使得数组的前k个数和后n-k个数的方差和最小。
要求化简方差公式,达到计算子序列方差的时间复杂度为O(n)。化简后要求空间复杂度为常数级别。
2.写逻辑回归的logloss损失函数
3.逻辑回归损失函数可以用mse吗?(从梯度角度)
算了mse的梯度,答了相较于logloss的梯度多了p(1-p),也就是
sigmoid的梯度,所以会梯度消失。面试官提醒mse是凸函数吗,如何证明是不是凸函数。
4.逻辑回归建模,如果只有9个正样本,一个负样本,那么有一列特征,这个特征对于的权重是正还是负?
没太理解,回答和特征值有关系
5.介绍认为做的最好的项目
6.项目中如何缓解曝光偏差的?
7.Embedding ANN召回用的什么工具?
关注公众号【面经熊】回复1获取上千篇互联网大厂求职面试经验!
更多互联网大厂面试经验戳链接https://mp.weixin.qq.com/s/cHWtErbwnrmtB3Gg3Isv2Q