腾讯 – 企业微信-高级/专家后台开发工程师-机器学习方向 职位分析和面试指导

职位简介:

该职位主要负责将业界最新推理框架应用于企业微信业务,保障多机多卡模型训练与推理部署,参与机器学习、深度学习模型落地的工程化开发,优化AI推理服务的可用性和稳定性,并带领团队完成大模型业务落地。候选人需熟悉Linux开发环境,具备扎实的数据结构和算法功底,能快速分析定位问题,熟练使用PyTorch框架并进行性能优化,同时熟悉主流大模型训练框架DeepSpeed、Megatron,掌握3D并行、ZeRO机制、Flash-Attn等原理及优化方向,熟悉容器化技术,熟练掌握CUDA性能优化手段,有算子编写优化项目经验者优先。工作地点为广州。

>> 在腾讯官网查看完整职位详情。

简历及面试建议:

在撰写简历时,你需要突出与大模型训练和推理相关的技术能力。首先,确保在技能部分明确列出PyTorch、DeepSpeed、Megatron等框架的使用经验,并具体说明你在这些框架上的项目经历,比如如何优化DDP训练代码的性能。其次,详细描述你在3D并行、ZeRO机制、Flash-Attn等方面的实际应用经验,包括你在项目中如何利用这些技术解决具体问题。如果你有CUDA性能优化或算子编写的经验,务必在简历中突出这些亮点,因为这些是面试官特别看重的加分项。此外,简历中的项目描述应尽量量化成果,比如通过优化将训练速度提升了多少百分比,或者减少了多少资源消耗。最后,别忘了强调你的团队领导能力,因为职位要求中提到了带领团队完成大模型业务落地。

面试时,面试官会重点考察你对大模型训练框架的理解和实际应用能力。准备几个你参与过的具体项目案例,详细说明你在项目中如何应用DeepSpeed、Megatron等框架,以及如何解决遇到的技术挑战。面试官可能会问到3D并行、ZeRO机制、Flash-Attn等技术的原理和优化方向,所以你需要对这些内容有深入的理解。此外,准备好讨论CUDA性能优化和算子编写的经验,面试官可能会要求你现场分析一段代码的性能瓶颈或提出优化建议。在回答问题时,尽量结合具体案例,展示你的技术深度和解决问题的能力。最后,面试官可能会考察你的团队协作和领导能力,所以准备一些你如何带领团队高效完成项目的例子。

在线咨询

提示:由 AI 生成回答,可能存在错误,请注意甄别。