【一面】(100min)
简历部分
1.自我介绍2.为什么不投算法岗位而是投数据分析岗位?3.说一个自己觉得值得讲的项目或实习经历4.项目相关的内容5.当数据缺失时怎么处理?除了直接舍去还有什么方法?如何使用聚类方式去填补缺失值?6.kmeans聚类的实现流程(讲了,中间讲到kmeans的初始点随机选取。接下来问...)6.1kmeans的初始点如果是随机选取的话,怎么知道哪种聚类结果是好的?比如说重复了100次,哪一次聚类是最优的呢?6.2kmeans中的距离是怎么定义的。kmeans计算距离的权重怎么分配?6.3如果是欧氏距离,那么性别(0(表未知)、1和2)和年龄(20、30和40)的这种怎么处理?6.4那么两个人一个20岁的男性一个20岁的女性,两个人一个20岁男性和一30岁男性,哪一对更加接近?7.建模时怎么选出有用的变量?
SQL
1.表table 字段qq号、age,得到年龄第n大的所有qq号2.表table,字段qqx,qqy,均为qq号,表示的是左边的关注右边的,求互相关注的qq号3.给了表格,让写出left join操作之后的结果
Python
1.对于生成器了解吗?知道xrange吗?2.用生成器实现斐波那契数列3.对字典按照value值进行排序4.深拷贝和浅拷贝的区别
机器学习
1.LR的原理2.LightGBM的原理
大数据
对于spark、MapReduce有没有过了解?
Linux
使用过Linux吗?
其他问题
1.有一个Tb级别的n行(n很大)1列的数据文件,如何对数据文件中的数据进行排序?2.给你一个数组,里面一堆数字,不告诉你这是什么数字,你会怎么分析?
个人信息
1.工作地点在深圳,方便吗?2.对加班是什么看法?3.觉得自己比其他人的优势在哪里?4.最近在学什么东西?5.leetcode刷了多少题,正确率如何?
反问问题
【二面】(55min)
简历部分
1.自我介绍2.项目/实习相关
Python
N级台阶,每次能走1、2或3步,一共有多少种走法?
其他问题
1.一个很大的数据文件(100G),里面只有一列,每一行为一个qq号。怎么得到重复次数最多的qq号?2.1瓶可乐1块钱,2个空瓶可换1瓶,你有20元,最多能喝多少瓶?3.在学校的时候,除了上课和导师给的任务以外,会自己学习吗?4.数据挖掘和数据分析不同的地方在哪?5.最近有没有看过什么数据分析的书?6.你个人的学习方法7.对加班是什么看法?8.觉得自己的优势在哪里?9.说说自己的缺点?10.能实习多久?11.导师对学生实习是什么态度?
反问问题
【HR面】(15min)
提问
1.自我介绍2.对自己前面两次面试的评价3.对前面两次面试官的评价4.说说自己的优点和缺点5.为什么投腾讯?6.还投了什么公司?7.个人的业余爱好8.除了专业相关的书籍以外,最近在看什么书?9.额外学习专业相关的内容是通过什么渠道?10.家住在哪里?父母是深圳本地人还是?11.最快能什么时候来实习?
反问问题