小米 – 新业务部-大模型部署优化工程师 职位分析和面试指导

职位描述:

1. 参与Android 平台的大模型(aigc + llm)开发和部署;
2. 负责大模型算子在NPU/GPU/CPU部署及高性能算子实现;
3. 负责大模型异构部署的算子性能调优及优化工作;
4. 分析算子/网络的性能瓶颈,提出性能优化策略,达成性能目标。

职位要求:

1. 本科及以上学历,计算机科学、电子工程或自动化等相关专业;
2. 熟悉并行/异构计算体系结构,在TPU/NPU/GPU一种平台有3年以上的开发和优化经验;
3. 熟悉计算机系统体系架构,软件性能优化加速;
4. 熟练使用至少一种主流Al训练框架,如TensorFlow、PyTorch、Caffe等;
5.具备业界常用高性能库(TensorRT/cuDNN/CUDA/OPENCV)开发和性能优化经验者优先;
6. 良好的团队沟通能力、技术攻关能力,责任心强,具备一定抗压能力。

招聘部门:

小米

工作地点:

北京市、上海市、西安市社招全职职位 ID:E9581

面试建议:

这个职位是小米新业务部的大模型部署优化工程师,核心在于将大模型技术落地到移动端设备。与其他AI部署岗位不同,这里特别强调Android平台的部署经验,以及针对移动端芯片(NPU/GPU/CPU)的性能优化能力。面试官会重点关注你在异构计算架构下的实战经验,特别是如何解决实际部署中的性能瓶颈问题。 建议应聘者重点准备以下内容:首先梳理自己在移动端AI模型部署的项目经验,特别是性能优化的具体案例。其次要熟悉主流AI框架在移动端的部署流程,准备1-2个你解决过的性能优化难题。最后,由于工作涉及跨团队协作,要准备好展示你的沟通能力和技术攻关能力的实例。技术层面,建议复习TensorRT/cuDNN等工具的使用经验,以及你对不同计算架构性能特点的理解。