职位描述:
1. 负责分析和优化大模型的分布式训练链路,提升训练性能和效率
2. 对大模型训练优化技术展开研究,并落地到自动驾驶
3. 负责推进训练框架和AI平台的结合,建立先进的训练调度机制、集群算力利用率评估机制等。
职位要求:
1. 扎实的编程基础(Python/C++)与良好的工程习惯
2. 熟练使用至少一种大规模训练优化框架,拥有大型预训练模型实践经验
3. 熟悉至少一种深度学习框架的架构设计和原理
4. 有CUDA开发、深度学习编译技术栈、AI开源社区贡献等任一经验者优先
5. 熟悉自动驾驶感知、端到端算法者优先
招聘部门:
小米
工作地点:
北京市 ID:A54427
面试建议:
这个职位是小米自动驾驶团队中的关键技术岗位,专注于大模型训练框架的研发和优化。与普通AI工程师不同,这个职位特别强调将大模型训练技术落地到自动驾驶场景的能力,需要候选人既懂大模型训练优化,又了解自动驾驶领域知识。面试官会特别关注候选人在大规模模型训练方面的实战经验,以及如何将这些技术应用到自动驾驶领域的思考。 在准备面试时,建议重点准备以下几个方面:首先,详细梳理你在大型预训练模型上的实践经验,包括遇到的性能瓶颈和优化方案;其次,准备一些将AI技术落地到具体业务场景的案例,特别是如果有自动驾驶相关经验更好;最后,要对主流深度学习框架的底层原理有深入理解,特别是分布式训练相关的技术细节。面试中可能会涉及CUDA优化、模型并行等技术细节的讨论,建议提前复习这些知识点。