职位描述:
1.负责京东信息安全大模型的应用研发工作,涵盖模型的持续预训练与优化、监督微调(SFT)以及强化学习等关键环节;
2.深入调研并积极探索大模型领域的前沿技术,包括先进的预训练方法、创新的 post-training 技术以及大模型强化学习技术;
3.参与大模型服务的部署实施,着力于模型量化处理和推理过程的加速优化,提升模型应用的性能和效率;
4.参与大模型在agent应用算法优化工作,提升agent任务执行效果;
职位要求:
1.有计算机科学、数学、统计学或相关领域的硕士或博士学位;
2. 熟悉Python与深度学习框架,具有良好的编程能力和扎实的数学理论基础;
3.熟悉掌握大模型相关技术,有实际主导或参与过大模型训练工作,包括不限于:预训练、SFT、强化对齐等;
4. 关注行业前沿进展,对技术开发及应用有热情,有自己的想法并乐于挑战自我;
5. 良好的沟通能力,跨团队协作能力,具备出色的规划、执行力,强烈的责任感,以及优秀的学习能力和自我驱动力。
加分项:
1. 有相关领域的开源项目、竞赛获奖、顶会论文发表/在投;
2. 熟悉DeepSpeed、Megatron-LM 、VeRL 、Unsloth 等LLM开源工具,具备大模型训练推理框架的优化以及开发能力。
3.熟悉大模型应用框架如Langchain等,工程能力较强;
符合京东价值观:客户为先、创新、拼搏、担当、感恩、诚信。
招聘部门:
京东
工作地点:
北京
注意:为了确保您掌握真实的招聘信息,上述信息均为原始内容。我们的“面试建议”和“模拟面试”均基于原始招聘信息设计和提供。
面试建议:
京东大模型算法专家这个职位有几个显著特点值得注意。首先,这是一个全栈式的大模型岗位,要求候选人不仅要懂算法研发,还要参与模型部署和优化,这种端到端的能力要求在大模型领域并不多见。其次,职位特别强调agent应用场景,这与京东电商业务特性密切相关,说明候选人需要具备将大模型技术落地到实际业务场景的能力。另外值得注意的是加分项中提到的开源工具经验,这反映了京东技术团队对工程实践能力的重视程度。
针对这个岗位的面试准备,建议从三个维度重点突破。技术层面要准备大模型全流程开发的详细案例,特别是预训练和微调过程中的具体挑战和解决方案。工程能力方面要重点展示对DeepSpeed等工具的实际使用经验,最好能准备性能优化相关的量化数据。业务理解方面要思考大模型在电商场景的应用可能,特别是agent如何提升用户体验。面试中可能会遇到技术深度和工程实践相结合的综合性问题,建议采用STAR法则来组织回答,既要体现技术深度,又要展示解决实际问题的能力。
在线咨询
提示:由 AI 生成回答,可能存在错误,请注意甄别。