【字节跳动】丨数据挖掘丨面经丨2021丨
11777
2020.12.22
发布于 未知归属地

楼主情况:

学历:双 985,考研上岸,选的是电子通信类专业,但实际做图像深度学习这种,对于一点编程都不会的我来说就是大坑;
竞赛:没参加过编程类比赛,为找数据分析数据挖掘方向的岗位参加过一些学校的比赛练手,比较简单,也参加过网上的数据挖掘类比赛,名次不靠前但学到了很多东西,就充当项目了;
论文:面试中有问到过论文发表的问题;
实习和项目:均无,只写了做过的一些比赛。

面试:

  1. 自我介绍;
  2. 挖简历,挨个介绍项目;
  3. 数据预处理流程,建模过程;
  4. 项目中用到了 LR,介绍 LR;
  5. SVM 敏感程度,非线性数据怎么处理;
  6. LR 和 SVM 对比;
  7. DT 决策树如何处理缺失值,是否敏感;
  8. RF 随机森林随机性体现在哪里;
  9. LSTM 讲一下,为什么比 RNN 效果更好;
  10. 对特征的细粒度划分是怎么做的,有什么依据吗;
  11. 特征对于结果的贡献怎么衡量;
  12. 正则化的本质和作用是什么;
  13. 链表有环判断(力扣原题);
  14. 数据库用过哪些;
  15. SQL 中 count(1),count(*),count(某列) 的区别;
  16. 开窗函数用过吗,有什么作用;
  17. 编辑距离(力扣原题);
  18. 未来三五年的职业规划;
  19. 认为自己有什么优缺点;
  20. 贝叶斯公式是什么
  21. 假设检验原理是啥,怎么做假设;
  22. XGBoost、GBDT、RF异同点;
  23. 数据库底层算法是什么了解吗;
  24. 为什么要用 b+ 树而不用其他的(b+树与b树的区别);
  25. SQL优化有哪些方法;
  26. Sql索引了解吗,索引的优点在哪;
评论 (4)