网易|数据挖掘|面经2021|
5582
2020.12.04
发布于 未知归属地

小白情况:
学历:双 985,考研上岸,选的是电子通信类专业,但实际做图像深度学习这种,对于一点编程都不会的我来说就是大坑;
竞赛:没参加过编程类比赛,为找数据分析数据挖掘方向的岗位参加过一些学校的比赛练手,比较简单,也参加过网上的数据挖掘类比赛,名次不靠前但学到了很多东西,就充当项目了;
论文:面试中有问到过论文发表的问题,与岗位无关而且还未发表,只是在投;
实习和项目:均无,只写了做过的一些比赛。

面试:
1,自我介绍(约 2min 左右吧);
2,针对简历上的内容详细问,问了很多项目细节,包括比赛规模、最后成绩、具体职责、以及和他人如何协作的等等;
3,问了SVM支持向量机的核函数常用的有哪些,分别适用于哪种问题;
4,核函数为什么要求正定;
5,Dropout 的作用;
6,随机森林的随机性体现在哪里;
7,维度灾难是什么,解决方法有哪些;
8,Svm 怎样处理高维特征;
9,常用的降维方式有哪些,优缺点分别是什么;
10,项目中用了降维之后效果有多少提升;
11,GBDT 系列模型的不同点,分别有什么优势;
12,XGBoost 与随机森林 RF 的区别;
13,树模型对缺失值如何处理;
14,做了 SQL 题,用到了开窗函数、排序;
15,还有概率论知识,问的比较少,高斯分布和 t 分布的相关内容;

总结~~感觉数据挖掘对于理论方面的要求更高一点,偏向算法方面,也就是说你不仅要会使用模型,更要知道他的底层原理,数学推导,以及如何改进;而数据分析更多偏向于业务,会和产品和用户产生更多的联系,对理论掌握可以不用很深。一般互联网公司的这两种岗位职能会分的更清楚,而我个人之前面试的一些非互联网企业或者国企就没有明确分开,所以还是因企业和业务方向而异~~

PS:海投的时候甚至还投过半导体行业的数据部门,像这种就和学科背景有很深关联,因为产生的数据是和元器件(三极管那种)或者电路有关的温度、湿度、压力值这种数据,必须有学科背景才能做下一步数据分析工作,而他们的招聘信息可能并不会写的很清楚,所以有了老学姐的血泪教训还希望大家注意甄别,省得浪费时间~~
最后祝大家都得偿所愿吧!

评论 (2)