职位简介:
该职位主要负责研发微信内通用的大模型训练框架gCore,支持文本、多模态、文生图/视频等不同业务场景,以及预训练、SFT、RLHF等不同阶段的训练需求,通过并行策略和算子优化提升训练吞吐。候选人需具备计算机相关专业本科及以上学历,2年以上相关开发经验,熟悉某一深度学习训练框架如PyTorch、TensorFlow等,并有底层优化或开源经验,同时需要良好的沟通能力和团队协作精神。
简历及面试建议:
在撰写简历时,你需要重点突出与大模型训练框架相关的经验。首先,详细描述你参与过的深度学习框架项目,特别是那些涉及性能优化或并行计算的案例。如果你有开源贡献经验,一定要明确列出,包括你贡献的具体模块和解决的问题。其次,量化你的成就,比如’通过优化XXX算子,将训练吞吐提高了XX%’这样的表述会非常加分。不要忘记强调你对PyTorch、TensorFlow等主流框架的熟悉程度,以及你对大模型训练全流程的理解。最后,虽然技术能力是关键,但腾讯也很看重团队协作,所以可以适当加入一些展示你沟通和协作能力的项目经历。
面试准备时,你需要对大模型训练框架的各个方面都有深入理解。准备好解释你过去项目中的技术决策,特别是那些涉及性能优化的部分。面试官可能会让你现场设计一个并行策略或分析某个算子的优化空间,所以复习一下常见的优化技术是必要的。同时,由于这个职位涉及多个业务场景,你需要展示你对不同场景下训练需求差异的理解。技术问题之外,腾讯很注重文化匹配,准备好用具体例子展示你的团队协作能力和解决问题的主动性。记住,面试不仅是展示你的技术深度,也是展示你如何将技术应用于实际业务场景的机会。
在线咨询
提示:由 AI 生成回答,可能存在错误,请注意甄别。