职位简介:
作为企业微信高级/专家后台开发工程师(机器学习方向),你将负责跟进业界最新推理框架并应用于业务,保障多机多卡模型训练与推理部署,参与企业微信机器学习、深度学习模型落地的工程化开发,优化AI推理服务的可用性和稳定性,并带领团队完成大模型业务落地。该职位要求熟悉Linux开发环境,具备扎实的数据结构和算法功底,能快速分析定位问题,熟练使用PyTorch框架并对DDP训练代码进行性能优化,掌握主流大模型训练框架DeepSpeed、Megatron及3D并行、ZeRO机制、Flash-Attn等核心技术原理与应用,熟悉容器化技术,具备CUDA性能优化和算子编写经验者优先。工作地点为成都。
简历及面试建议:
在撰写简历时,你需要特别突出与大模型训练和AI推理优化相关的技术能力。首先,确保在专业技能部分明确列出PyTorch、DeepSpeed、Megatron等框架的使用经验,并具体说明你在这些技术上的实践成果,比如优化过的DDP训练代码性能提升了多少。其次,详细描述你在3D并行、ZeRO机制、Flash-Attn等核心技术上的理解和应用案例,这些是面试官非常看重的点。如果你有CUDA性能优化或算子编写的项目经验,务必单独列出并量化成果,比如通过优化某个算子将推理速度提升了30%。此外,容器化技术也是加分项,可以简要提及你在Docker或Kubernetes上的使用经验。最后,别忘了强调你的团队领导能力,因为职位描述中提到需要带领团队完成大模型业务落地,所以任何与团队协作或项目管理相关的经验都会让简历更具竞争力。
面试时,面试官会重点考察你对大模型训练框架和AI推理优化的实际应用能力。准备几个具体的项目案例,详细说明你如何解决技术难题,比如如何优化DDP训练代码的性能,或如何应用3D并行技术提升模型训练效率。技术细节是关键,面试官可能会深入询问你对ZeRO机制或Flash-Attn的理解,所以确保你对这些技术的原理、使用场景和优化方向有透彻的认识。此外,准备好回答关于CUDA性能优化的问题,如果你有算子编写经验,可以带上代码片段或性能对比数据。面试中可能会涉及算法和数据结构的基础问题,所以复习一下常见的算法题和系统设计题。最后,展示你的团队协作和领导能力,面试官可能会问你在团队中扮演的角色以及如何推动项目进展。保持自信,用具体的案例和数据支撑你的回答,这会大大增加你的可信度。
在线咨询
提示:由 AI 生成回答,可能存在错误,请注意甄别。