职位描述:
1、大模型推理优化和计算框架的设计和开发工作,提升大模型推理效率;
2、通过量化、并行计算、访存优化等方法,支持单卡、多卡、多机情况下模型推理时延和吞吐效率的提升;
3、进行模型性能分析和调优,识别和解决瓶颈问题,提升模型的推理速度;
4、实施并维护自动化工具和流程,简化模型推理部署过程;
5、跟踪最新的研究进展和技术趋势,提出改进和创新的想法,推动团队技术发展。
职位要求:
1、计算机、数学相关专业本科及以上学历;
2、熟练掌握C++/Python等编程语言,在模型训练和推理方面有丰富的编程和优化经验;
3、熟悉常见的机器学习/推理框架,如Pytorch、HF、vLLM、SGLang等。
4、具有大模型推理优化或深度学习推理优化经验者优先,参与推理框架社区者优先;
5、具备时新学术论文阅读以及实验能力者优先;
招聘部门:
小米
工作地点:
北京市
面试建议:
面试小米公司的大模型推理优化实习生职位,你需要特别关注自己在推理优化和计算框架开发方面的能力。这个职位不仅要求你具备扎实的编程基础,还需要你对大模型推理的各个环节有深入的理解和实践经验。面试官会重点考察你是否能够通过量化、并行计算、访存优化等方法提升模型的推理效率,以及你是否能够识别和解决模型推理中的瓶颈问题。 在准备面试时,建议你重点复习和准备自己在模型推理优化方面的项目经验,尤其是那些能够体现你解决实际问题能力的案例。同时,保持对最新研究进展和技术趋势的关注,因为面试官可能会询问你对某些新技术或论文的看法。此外,熟悉常见的机器学习/推理框架,并能够展示你在这些框架上的实践经验,也会大大增加你的竞争力。