小米 – 新业务部-AI高性能算子开发工程师/专家 职位分析和面试指导

职位描述:

基于NPU平台,开发高性能计算库,支撑CV,NLP,大模型等模型运行,包括:
1.完成高性能算子的需求分析与分解,满足NPU的各种应用场景;
2.与芯片/架构团队紧密配合,持续优化算子性能,逐步完善软硬件架构;
3.完成各类算子的软件方案设计及开发;
4.分析算子/网络的性能瓶颈,提出性能优化策略,达成性能目标;

职位要求:

1.图像处理、模式识别、机器学习等相关专业硕士及以上学历;
2.精通C++/Python软件编程语言;
3.熟悉Onnx/TensorFLow/Pytorch一种主流神经网络框架,熟悉各类算子;
4.熟悉并行/异构计算体系结构,在TPU/NPU/GPU一种平台有2年以上的开发和优化经验;
5.具备业界常用高性能库(TensorRT/cuDNN/CUDA/OPENCV)开发和性能优化经验者优先;
6.熟悉指令流水,计算机体系结构;
7.良好的团队沟通能力、技术攻关能力,责任心强,具备一定抗压能力。

招聘部门:

小米

工作地点:

上海市、北京市社招全职职位 ID:J5452

面试建议:

小米这个AI高性能算子开发岗位非常注重技术深度与实战能力的结合。不同于普通的算法工程师,它要求候选人既能理解上层深度学习框架的算子需求,又能深入芯片架构层面进行性能调优。这种横跨算法与硬件的复合能力是该岗位最核心的差异化要求,特别是对NPU/GPU等异构计算平台的优化经验会成为关键筛选标准。 建议候选人重点准备三个维度的内容:首先是用具体案例展示在TensorRT/cuDNN等库上的性能优化成果,最好能提供量化数据;其次要准备对计算机体系结构的理解,比如如何通过指令流水优化来提升算子效率;最后需要体现跨团队协作能力,准备与芯片团队合作解决性能瓶颈的实际案例。面试时可能会被要求现场分析某个算子的性能瓶颈并给出优化方案,因此需要提前熟悉常见算子的计算模式与优化技巧。