职位描述:
1. 研发高性能推理算法: 设计并实现自注意力机制优化、并行推理、负载均衡、弹性容量等无损推理服务优化算法,提升服务效率与稳定性;
2. 探索轻量化推理技术: 深入研究和应用有损推理加速算法,包括但不限于知识蒸馏、模型量化、网络剪枝、KV-Cache压缩等,实现模型的高效部署;
3. 聚焦软硬件一体优化策略: 从计算图优化、算子融合、计算通信重叠、专家并行、vGPU虚拟化等多个维度入手,显著提升端到端推理性能。
职位要求:
1. 教育背景: 计算机科学、人工智能或相关 STEM 领域硕士及以上学历,具备扎实的理论基础;
2. 技术能力:
* 优秀的基础: 拥有深厚的计算机科学理论根基与扎实的算法功底;
* 编程实力: 具备卓越的编程能力和良好的工程实践习惯;
* 引擎熟悉度: 熟练掌握 vLLM, SGLang, TensorRT-LLM 等主流大模型推理引擎之一,理解其核心原理;
3、经验优先:
* 在自然语言处理、多模态大模型、扩散模型、图神经网络(GNN)等领域有研究、技术开发或实际落地经验;
* 作为核心骨干在国际顶会(NeurIPS, ICML, ICLR,CVPR, ACL等)发表过高质量论文;
* 在知名开源项目(如Hugging Face Transformers, DeepSpeed,vLLM,SGLang,TensorRT-LLM等)中有显著贡献;
* 在权威人工智能相关竞赛(如Kaggle、天池)中获得优异名次;
4、软性素质:
* 沟通协作: 具备出色的沟通表达能力和高效的团队协作精神;
* 技术追求: 对技术有强烈的好奇心与钻研精神,追求卓越;
* 解决问题: 具备优秀的自驱力,能主动发现问题、分析问题并创造性地解决问题。
符合京东价值观:客户为先、创新、拼搏、担当、感恩、诚信。
招聘部门:
京东
工作地点:
北京
注意:为了确保您掌握真实的招聘信息,上述信息均为原始内容。我们的“面试建议”和“模拟面试”均基于原始招聘信息设计和提供。
面试建议:
京东的大模型推理性能优化算法工程师职位是一个高度技术性的岗位,专注于提升大模型推理的效率和性能。这个职位的独特之处在于它不仅要求候选人具备扎实的算法基础,还需要对特定的大模型推理优化技术有深入理解。面试官会特别关注候选人在自注意力机制优化、并行推理、负载均衡等方面的实际经验,以及是否熟悉主流推理引擎的核心原理。此外,轻量化推理技术如知识蒸馏、模型量化等也是考察重点。值得注意的是,这个职位还强调软硬件一体优化策略,这意味着候选人需要具备跨领域的知识体系。
在准备这个职位的面试时,首先要确保你的技术基础扎实,特别是算法和编程能力。简历中应该突出你在大模型推理优化方面的具体项目经验,包括使用的技术、解决的问题和取得的成果。如果你有在顶会发表论文或参与知名开源项目的经历,一定要重点展示。面试时,准备好详细解释你在推理性能优化方面的技术选择和实践经验。建议提前研究京东可能使用的大模型技术栈,并准备一些优化方案的想法。在技术讨论中,展示你的问题解决能力和创新思维很重要。同时,也要准备一些软技能的例子,如团队协作和沟通能力,因为这些都是职位要求中明确提到的。
在线咨询
提示:由 AI 生成回答,可能存在错误,请注意甄别。