京东 – 多模态算法工程师 职位分析和面试指导

职位描述:

1. 构建基于计算机视觉 + VLM/MLLM 的容器与商品语义理解体系,融合图像、点云与文本信息,提高复杂 SKU 识别与定位鲁棒性。

2. 设计检测/分割 + 3D 点云融合网络,实现多品混放场景的实例分割与 6D 抓取点预测。

3. 对 LLaVA、Qwen2-VL、InternVL2.5 等多模态大模型进行指令微调,支持机器人自然语言任务下达与动态规划。

4. 负责相机、雷达联合标定,多传感器融合(RGB-D + 点云 + 力矩传感器)。

5. 搭建自动标注与主动学习流水线,建设数据飞轮。

6. 关注行业最新多模态技术,快速验证并落地仓储场景。

职位要求:

1. 硕士及以上学历,计算机视觉、机器学习、机器人等相关方向,3-5 年以上多模态/视觉算法研发经验。

2. 熟悉 VLM 及多模态模型原理,掌握 LoRA/QLoRA、PEFT、RAG 等微调与推理加速技术者优先。

3. 熟悉跨模态 Transformer、3D 点云-图像融合,具备点云预处理与配准(ICP/NDT/RANSAC)实践者优先。

4. 熟练使用 PyTorch/Tensorflow,熟练使用 OpenCV、Open3D、PCL;具备 TensorRT、Triton、ONNX Runtime 部署与性能调优经验者优先。

5. 在 CVPR/ICRA/NeurIPS 等顶会发表或主导开源项目者优先。

6. 具有良好的工程规范、代码质量与跨团队沟通协作能力。

符合京东价值观:客户为先、创新、拼搏、担当、感恩、诚信。

招聘部门:

京东

工作地点:

北京

注意:为了确保您掌握真实的招聘信息,上述信息均为原始内容。我们的“面试建议”和“模拟面试”均基于原始招聘信息设计和提供。

面试建议:

京东的多模态算法工程师职位是一个极具挑战性的岗位,它要求候选人不仅要掌握前沿的多模态算法技术,更要具备将这些技术落地到仓储场景的能力。从职位描述中可以看出,这个岗位有几个关键特点:首先,它非常强调多模态技术的实际应用能力,特别是3D点云与图像的融合技术,这在一般的视觉算法岗位中并不常见;其次,它要求候选人具备大模型微调的能力,包括LoRA/QLoRA等高效微调技术,这在当前AI领域是非常前沿的技能;最后,这个岗位特别注重工程落地能力,包括模型部署优化、自动标注流水线建设等,这些都是确保技术能够真正产生业务价值的关键环节。

针对这个岗位的面试准备,我建议从以下几个方面着手:在简历中,要重点突出你在多模态算法研发和落地方面的经验,特别是3D点云处理和大模型微调的项目经验。如果有仓储或物流相关的项目经验,一定要详细描述。在技术面试环节,要做好深入讨论算法细节的准备,面试官很可能会就点云配准算法、多模态融合网络设计等专业技术问题进行深入探讨。同时,也要准备一些实际案例,说明你是如何解决工程落地中的挑战的。在行为面试环节,京东非常看重价值观匹配,要准备一些体现你’客户为先、创新、拼搏’等京东价值观的案例。最后,如果你有顶会论文或开源项目,一定要重点准备,这会是很大的加分项。

在线咨询

提示:由 AI 生成回答,可能存在错误,请注意甄别。