职位简介:
作为微信大模型算法专家,你将主导WeLM语言模型的全流程研发工作,包括基座模型训练、价值对齐、推理优化及智能体开发等核心环节,需要设计并优化大规模分布式训练系统,同时开展前沿领域研究并与产品团队协作落地AI应用。该职位要求候选人具备大型NLP项目成功经验,对构建复杂AI系统充满热情,并拥有计算机科学、数学或相关领域的专业背景。工作地点位于北京。
简历及面试建议:
在撰写简历时,要特别突出你在大型语言模型项目中的实际贡献。不要简单罗列项目名称,而是用量化指标说明你的工作成果,比如’优化了千亿参数模型的分布式训练效率,使训练速度提升30%’。重点展示你参与过的完整模型生命周期经历,从基座训练到应用落地的全链条能力。对于学术背景,除了学位信息外,可以简要提及与分布式计算或NLP相关的论文发表。微信团队特别看重技术到产品的转化能力,所以简历中应该包含1-2个你主导的AI应用落地案例,说明技术如何解决了实际问题。
面试将深度考察你的技术细节掌握程度。准备好用白板推导常见语言模型的数学原理,并解释你在过往项目中遇到的技术挑战及解决方案。面试官可能会要求你现场设计一个分布式训练优化方案,建议提前复习参数服务器架构和通信优化技术。产品思维也是考察重点,要准备2-3个案例说明你如何平衡技术先进性和产品需求。技术问题回答要结构化:先说明问题背景,再解释技术选择依据,最后总结实际效果。遇到开放性问题时,可以主动询问业务场景细节,这能展现你的产品敏感度。
在线咨询
提示:由 AI 生成回答,可能存在错误,请注意甄别。