腾讯 – 微信-后台开发高级工程师-大模型训练框架方向(深圳) 职位分析和面试指导

职位简介:

该职位主要负责研发微信内通用的大模型训练框架gCore,支持文本、多模态、文生图/视频等不同业务场景,以及预训练、SFT、RLHF等不同阶段的训练需求,通过并行策略和算子优化提升训练吞吐。候选人需具备计算机相关专业本科及以上学历,2年以上相关开发经验,熟悉深度学习训练框架如PyTorch、TensorFlow等,并有底层优化或开源经验,同时需要良好的沟通能力和团队协作精神。

>> 在腾讯官网查看完整职位详情。

简历及面试建议:

在撰写简历时,你需要特别突出与大模型训练框架相关的经验。首先,确保在专业技能部分明确列出你熟悉的深度学习框架,如PyTorch、TensorFlow等,并注明你的熟练程度。如果你有Megatron-LM、DeepSpeed或Transformers的经验,一定要单独列出,因为这些是职位描述中特别提到的框架。其次,在工作经历部分,详细描述你参与过的大模型训练项目,特别是你在框架优化、并行策略或算子优化方面的具体贡献。用数据和指标来量化你的成果,比如’通过优化XX策略,将训练吞吐提升了XX%’。如果你有开源项目贡献经验,一定要单独列出项目名称和你的具体贡献。最后,不要忘记强调你的工程素养和团队协作能力,这些都是职位要求中明确提到的。

面试准备时,你需要重点准备以下几个方面的内容。首先,深入复习大模型训练的相关知识,包括但不限于并行训练策略、算子优化技术、不同训练阶段的特点等。准备好解释你在过往项目中遇到的技术挑战和解决方案。其次,针对微信gCore框架的特点,思考如何将你的经验应用到新的场景中。面试官可能会考察你对框架设计的理解,所以准备好讨论你对训练框架架构的看法。技术问题之外,也要准备一些行为面试问题的答案,展示你的沟通能力和团队协作精神。腾讯特别看重’积极主动,勇于接受挑战’的品质,所以准备好用具体事例证明你具备这些特质。最后,记得准备一些关于微信大模型应用场景的问题,展示你对公司和业务的了解。

在线咨询

提示:由 AI 生成回答,可能存在错误,请注意甄别。