职位描述:
1.负责端侧大模型量化算法的研究与开发,包括但不限于低比特量化、混合精度量化等,提升模型推理效率,降低计算资源消耗
2.与大模型研发团队紧密合作,针对不同架构的大模型进行量化适配,确保量化后的模型性能损失最小化
3.搭建和优化大模型量化工具链,实现量化流程的自动化和高效化,提高整体研发效率
4.跟踪大模型量化领域的最新技术动态,将前沿技术引入实际项目,保持公司技术的先进性
职位要求:
1.计算机科学、数学、统计学等相关专业,硕士及以上学历
2.扎实的编程基础,熟练掌握 C++和Python编程语言,熟悉常用深度学习框架,如PyTorch、TensorFlow
3.深入理解大模型的原理和架构,有 2 年以上大模型量化相关工作经验,有实际落地项目经验者优先
4.熟悉大模型量化的原理,包含低比特量化、混合精度量化等,熟悉常用量化算法,比如Smoothquant、GPTQ、AWQ等,熟悉端侧使用的量化工具高通(Qnn、AIMet)、联发科(Neural Pilot)
5.具备良好的团队协作能力和沟通能力,能够在跨部门合作中有效推进项目进展
6.对新技术有强烈的好奇心和学习热情,能够快速掌握并应用到实际工作中
招聘部门:
小米
工作地点:
北京市
面试建议:
大模型量化工程师是一个技术门槛较高的岗位,面试官会特别关注候选人在量化算法和端侧部署方面的实际经验。不同于一般的深度学习工程师,这个岗位要求对模型压缩和量化有深入理解,特别是要熟悉各种量化算法在端侧设备上的实现和优化。 建议候选人重点准备量化算法相关的技术细节,特别是Smoothquant、GPTQ等主流算法的实现原理和优缺点比较。同时要熟悉端侧部署工具链的使用经验,最好能准备一些实际项目案例来说明你如何解决量化过程中的性能损失问题。面试中可能会要求你现场分析某个量化算法的适用场景,或者讨论如何优化一个具体的量化流程。除了技术能力,小米也很看重团队协作能力,可以准备一些跨部门合作的经验案例。