小米 – 自动驾驶-高性能计算算法研究员 职位分析和面试指导

职位描述:

1. 负责AI框架中GPU算子的极致性能优化
2. 参与AI框架的软件设计与研发
3. 参与自动驾驶算法的异构计算加速库开发
4. 参与自动驾驶算法在端侧的模型部署工作

职位要求:

1. 高性能计算、异构计算、科学仿真相关专业
2. 扎实的C++编程基础与良好的工程习惯,熟悉常用的数据结构及算法
3. 熟悉GPU硬件架构与CUDA编程模型(或类似如OpenCL编程模型),擅长编写极致性能的CUDA代码
4. 熟悉CUTLASS尤其是CUTLASS3.0开发者优先
5. 熟悉GPU逆向工程,有PTX/SASS代码开发经验者优先。

招聘部门:

小米

工作地点:

北京市 ID:A157882

面试建议:

这个职位是小米自动驾驶团队中的核心研发岗位,专注于AI框架的GPU算子性能优化和异构计算加速。与其他普通算法岗位不同,这里特别强调对GPU底层架构的理解和极致性能优化能力,这将成为面试的重点考察方向。 建议应聘者重点准备三个方面:首先是对GPU硬件架构的深入理解,包括内存层次结构、线程调度机制等;其次是CUDA编程的实战经验,最好能准备几个性能优化案例,说明如何通过特定技巧提升计算效率;最后是CUTLASS等加速库的使用经验。面试时可能会要求现场分析或优化代码片段,所以要保持编程思维的活跃度。另外,如果有逆向工程经验,一定要准备好相关项目细节,这会是很大的加分项。