京东 – 大模型研发工程师/架构师 职位分析和面试指导

职位描述:

作为大模型研发工程师/架构师,您将深度参与或主导以下一个或多个关键领域的工作:

1. 强化学习大模型Ray引擎开发、优化与集群维护:Ray分布式训练集群架构设计与优化,强化学习算法集成与优化,模型训练引擎性能瓶颈分析、调优与加速,分布式训练集群资源调度与管理优化及训练集群的稳定性与可维护性提升等;

2. MoE大模型混合精度训练、量化、蒸馏与压缩性能优化:MoE模型高效训练策略研究与实现、混合精度训练深度优化,MoE大模型量化(Quantization)技术研发与落地,模型蒸馏(Knowledge Distillation)与剪枝(Pruning)策略探索及模型压缩与部署优化等。

职位要求:

1. 硕士及以上学历,计算机、数学、人工智能及STEM等相关专业;

2. 拥有扎实的计算机科学功底和编程能力,熟悉常见算法和数据结构,具有良好的编程习惯;

3. 熟悉语言或多模态模型的经典模型结构,Ray等开源强化学习训练引擎、大规模MoE模型量化、蒸馏等基础技术,相信AGI和对相关工作抱有热情;

4. 工作认真务实,科学规划,具有极致的探究精神且知行合一,具备较强的责任感;

加分项:

1. 有大模型相关的研发经验的工作者优先;有ACM/NOI等竞赛经历者优先;

2. 熟悉主流大模型开源框架,曾深度参与大模型训练与性能优化等项目;

3. 具有扎实的工程能力,熟悉开源大模型相关工具栈使用,有积极提升效率效果的意识。

符合京东价值观:客户为先、创新、拼搏、担当、感恩、诚信。

招聘部门:

京东

工作地点:

北京

注意:为了确保您掌握真实的招聘信息,上述信息均为原始内容。我们的“面试建议”和“模拟面试”均基于原始招聘信息设计和提供。

面试建议:

京东的大模型研发岗位聚焦于两大核心技术方向:强化学习大模型Ray引擎和MoE大模型优化。这个职位最与众不同的地方在于它既要求扎实的分布式系统架构能力,又需要前沿的模型优化技术。面试官会特别关注候选人在Ray集群优化和MoE模型量化方面的实际经验,这不同于一般AI岗位更注重算法理论。另一个关键点是京东明确要求’极致的探究精神’,这意味着他们需要能深入技术细节并持续优化的工程师,而非仅停留在表面应用的开发者。

准备这个岗位面试时,建议重点准备三个方面的内容:首先确保能清晰解释Ray分布式训练的原理和你参与过的优化案例,最好准备具体的性能提升数据;其次要深入理解MoE模型的量化技术细节,包括8-bit/4-bit量化的实现差异;最后要准备1-2个体现你’探究精神’的具体事例,比如如何通过系统性的实验解决某个技术难题。在简历中,建议将大模型相关的项目经验放在最前面,特别是涉及性能优化的部分要量化结果。面试时可能会被要求现场设计一个分布式训练方案或分析模型压缩的trade-off,建议提前模拟这类场景。着装方面保持技术岗位的商务休闲即可,但要注意京东特别强调价值观匹配,可以准备体现’客户为先’和’创新’精神的案例。

在线咨询

提示:由 AI 生成回答,可能存在错误,请注意甄别。