小米 – 大模型推理引擎开发工程师(高性能算子) 职位分析和面试指导

职位描述:

– 通过编译优化、模型并行优化、图融合、高性能算子开发、低精度计算、Memory复用、Cache优化、高并发服务请求优化等技术,打造业界领先的高性能训推引擎;
– 设计和开发高性能算子库,研究最新的GPU计算技术和优化方法,以充分利用GPU的并行计算能力,支持大模型推理优化和部署;

职位要求:

– 硕士及以上学历,计算机、软件工程、数学等相关专业,具备扎实计算机理论基础和丰富编程经验,在深度学习领域有深入研究与实践。
– 精通 Python,熟练掌握至少一种深度学习框架(如 PyTorch),理解深度学习和transformer系列算法,有丰富模型开发与调优经验,能独立搭建复杂模型并优化性能。
– 熟悉主流的并行编程以及性能优化技术,熟悉CUDA和TensorCore编程,有相关高性能优化经验(nsys/ncu)优先;
– 熟悉flashattention,TransformerEngine, flashinfer等算子库, 有使用triton/tilelang等做高性能算子开发经验优先
– 有良好团队协作与沟通能力,能与不同背景成员有效沟通协作,责任心强、敬业热情,能承受工作压力,保证项目按时高质量交付。

招聘部门:

小米

工作地点:

北京市 ID:A100905

面试建议:

这个职位是小米公司大模型推理引擎开发团队的核心技术岗位,主要聚焦于高性能算子开发和推理优化。与普通深度学习工程师不同,这个岗位特别强调对GPU底层计算能力的极致优化能力,需要候选人具备从算法到硬件的全栈优化思维。 建议重点准备GPU编程和性能优化相关的实战经验。面试官很可能会深入考察你对CUDA编程的理解程度,以及如何解决实际遇到的计算瓶颈问题。可以准备几个典型的性能优化案例,比如如何通过nsys/ncu工具分析性能瓶颈,以及具体的优化手段。同时要熟悉最新的算子库技术,如flashattention和TransformerEngine的实现原理。另外,团队协作能力也是考察重点,虽然这是个技术岗位,但大模型开发往往需要多人协作,要准备好展示你如何与其他工程师有效配合的案例。

在线咨询


请输入您的问题:

提示:由 AI 生成回答,可能存在错误,请注意甄别。