京东 – AI Infra 开发工程师 职位分析和面试指导

职位描述:

1. 负责大模型推理引擎的设计、开发和优化,特别是针对MOE架构专家分布式的推理性能优化;

2. 深入研究和实现MOE模型的底层技术优化,包括CUDA/Kernel算子优化、内存/显存管理策略和计算图优化等;

3. 设计和优化MOE模型的专家分布式调度策略,实现高效的专家路由和负载均衡;

4. 针对MOE架构大模型进行通信优化,包括通信性能和通信/计算策略流程的优化,减少分布式推理中的通信开销;

5. 探索和实现大模型推理引擎的前沿技术,推动团队技术能力的持续提升,同时编写高质量的技术文档,参与团队技术分享和知识沉淀。

职位要求:

1. 学历要求: 计算机科学、人工智能、软件工程或相关专业,硕士及以上学历。

2. 技术背景:

* 熟悉深度学习框架(如PyTorch、TensorFlow等),具有大模型开发和优化的实际经验。

* 深入理解MOE(Mixture of Experts)架构,具备相关模型的设计和优化经验。

* 熟悉GPU/TPU硬件架构,具备CUDA、OpenCL等高性能计算开发经验。

* 熟悉分布式训练和推理技术,了解NCCL、MPI、RDMA等通信库的优化策略。

* 具备底层计算优化经验,如算子融合、内存优化、计算图优化等。

3. 编程能力: 精通Python、C++,具备高性能代码开发和调试能力。

4. 加分项:

* 在顶级会议(如NeurIPS、ICML、CVPR等)发表过相关论文。

* 有大规模分布式系统开发经验,熟悉Kubernetes、Docker等容器化技术。

* 熟悉大模型推理引擎(如DeepSpeed、vllm和sglang等)的源码和优化策略。

符合京东价值观:客户为先、创新、拼搏、担当、感恩、诚信。

招聘部门:

京东

工作地点:

北京

注意:为了确保您掌握真实的招聘信息,上述信息均为原始内容。我们的“面试建议”和“模拟面试”均基于原始招聘信息设计和提供。

面试建议:

京东的AI Infra开发工程师职位专注于大模型推理引擎的优化,尤其是MOE架构的专家分布式推理性能优化。这一职位不仅要求深厚的编程能力,还需要对GPU/TPU硬件架构有深入理解,以及对分布式计算和通信优化的实战经验。面试官会特别关注你在CUDA/Kernel算子优化、内存/显存管理策略和计算图优化等方面的实际经验。此外,如果你在顶级会议发表过相关论文或有大规模分布式系统开发经验,将会是极大的加分项。

在准备面试时,你需要重点展示你在MOE架构和大模型推理优化方面的实际项目经验。简历中应详细描述你参与过的相关项目,特别是你在CUDA优化、分布式调度策略或通信优化中的具体贡献。面试过程中,面试官可能会深入探讨你的技术实现细节,因此确保你对项目的每一个环节都有清晰的理解。此外,准备好讨论你在面对技术挑战时的解决思路和方法,这将展示你的问题解决能力和创新思维。着装方面,保持专业但不必过于正式,技术面试更注重你的技术能力和项目经验。

在线咨询

提示:由 AI 生成回答,可能存在错误,请注意甄别。