职位描述
工作内容:
1. 设计实现规划控制数据闭环data pipeline基础设施,
包括且不限于在海量的数据上完成:数据标注、仿真评估、数据特征挖掘、训练样本生成、驾驶指标统计等工作
2. 进行PnC专用大规模计算系统的研发,用以支持前述多个业务的海量数据处理
3. 与策略团队一起进行数据链路的研发工作
4. 进行数据挖掘策略的研发工作
任职要求:
1. 扎实的python、C++代码能力
2. 对hadoop、spark、k8s等分布式计算、调度系统有一定的使用经验
3. 对大数据的计算、存储选型,和业务数据治理有一定经验
4. 有大规模深度学习训练数据流相关经验的优先,特别是自动驾驶相关数据流处理经验的