京东 – 算法引擎工程师(训练/样本/算力) 职位分析和面试指导

职位描述:

招收岗位:AI平台大模型引擎、算力调度、样本引擎

【大模型引擎】

1.参与CTR、LLM、多模态等大模型算法引擎、样本引擎以及大模型训练系统的设计、开发和优化,解决训练和离线推理过程中的技术和性能问题;

2.针对大规模异构分布式算力和计算进行优化,提高计算效率和可扩展性;

3.深入零售核心算法业务,分析业务功能和性能痛点,设计合理的技术优化方案并确保实际落地;

4.参与制定核心业务项目计划和需求分析,确保项目按时交付和达到高质量标准。

【算力调度】

1.负责GPU/NPU算力平台的规划、系统架构设计与开发运维工作,集成云原生能力、开发调度、训练、推理等相关功能,提升平台资源利用率和扩展能力;

2.负责算力集群的维护、监控、调优和故障定位;

3.持续运营,改进平台性能、易用性和稳定性,优化用户体验。

【样本引擎】

1.负责大模型的数据处理、存储、IO等全流程方案实施和性能优化;

2.负责平台化的样本工程、样本引擎能力建设,保障样本数据时效性和准确性;

3.负责算法应用、算法引擎、算法平台多角度协同优化。

职位要求:

【大模型引擎】

1.精通Python或C/C++开发,具备优秀的数据结构与算法能力,代码规范高效,具备良好的工程实践和团队协作能力;

2.熟悉深度学习基础理论和主流模型架构,能熟练使用TensorFlow/PyTorch等框架进行模型开发和训练;

3.掌握CUDA编程和GPU加速技术,具备模型性能调优经验,有国产AI芯片开发经验者优先;

4.了解主流分布式训练框架,具有分布式系统开发或优化经验者优先。

【算力调度】

1.本科及以上学历,计算机、数学、通信等相关专业,3年以上相关工作经验,具备大规模GPU集群运维及优化经验,有万卡集群管理或国产AI芯片经验者优先;

2.熟练掌握Golang/Python等语言,熟悉Kubernetes、Kubeflow等云原生技术栈,具备二次开发经验;

3.深入理解调度器原理(如kube-scheduler),有GPU调度研发经验,能持续优化集群资源使用效率并快速定位问题;

4.责任心强,抗压能力突出,工作积极主动,具备良好的问题解决和团队协作能力。

【样本引擎】

1.本科及以上学历,3年以上工作经验,有算法IO优化、特征平台建设经验或开源社区贡献者优先;

2.精通Java/Scala/Python至少一门语言,熟悉Linux/Unix开发环境,具备优秀的编码能力和工程质量意识;

3.熟悉Spark/Flink/Iceberg/Hudi等大数据技术及TensorFlow/PyTorch等AI框架,有源码级二次开发经验者优先;

4.具备优秀的业务理解、沟通协作能力,学习能力强,工作积极主动。

符合京东价值观:客户为先、创新、拼搏、担当、感恩、诚信。

招聘部门:

京东

工作地点:

北京

注意:为了确保您掌握真实的招聘信息,上述信息均为原始内容。我们的“面试建议”和“模拟面试”均基于原始招聘信息设计和提供。

面试建议:

京东这个算法引擎工程师岗位非常独特,它实际上涵盖了AI基础设施建设的三个关键方向:大模型训练优化、算力资源调度和样本数据处理。这种复合型岗位在业内并不多见,通常这些职责会被拆分成不同的团队。特别值得注意的是,职位描述中反复强调对国产AI芯片的支持经验,这反映了京东在技术自主可控方面的战略考量。面试官会特别关注候选人在异构计算环境下的实战经验,而不仅仅是理论知识的掌握程度。

准备这个岗位的面试时,建议你重点准备三个维度的案例:首先是大规模分布式训练的性能优化案例,要能详细说明你如何解决特定的性能瓶颈;其次是GPU集群调度方面的实战经验,特别是资源利用率提升的具体数据;最后是样本数据处理管道的优化案例。在技术深度方面,面试官很可能会考察你对TensorFlow/PyTorch框架底层原理的理解,建议复习相关源码。面试着装方面,互联网公司通常比较随意,但京东作为头部企业,建议选择商务休闲风格以显示专业度。

在线咨询

提示:由 AI 生成回答,可能存在错误,请注意甄别。