职位描述
岗位职责:
1.负责视觉算法中基础算子的性能优化,例如游程编码,DSL,指令集(SSE指令集、MMX)加速,CUDA等并行计算设计与实现;
2.负责视觉加速算法的产品化,包括封装、编译、构建、优化等工作等;
3.根据具体需求,进行算法前沿调研,进行算法性能优化设计达到算法优化加速的目的,包括但不限于模型蒸馏,量化等;
4. 具有研究GPU、NPU、ARM、DSP等平台高性能计算技术经验的优先;
5. 具有核心算法在GPU、NPU、ARM、DSP平台上的移植与优化经验的优先。
岗位要求:
1.计算机、软件工程、电子信息、自动化等相关专业优秀本科生、硕士或博士毕业 ;
2.较强的系统工程和编程能力,包括linux,cmake,python,shell,c/c++等等;
3.较好的底层基础知识,对计算机体系结构有一定的理解能力;
4.对训练/部署框架有一定了解者优先(PyTorch/TensorFlow/OneFlow, NCNN/MNN,TVM/MLIR) ;
5.了解CPU或GPU体系结构,对以下其中一种技术有研究和实践经验的优先:
6.具备arm、X86等CPU体系结构的性能调优经验,熟悉相关平台汇编指令,熟悉多核并行编程;
7.具备GPU体系结构上的性能调优经验,熟悉CUDA或OpenCL在GPU上的开发调优;
8.对技术有热情。喜欢追根究底。