职位描述:
1、深耕机器人多模态大模型,围绕着机器人多模态感知、移动操作和运动轨迹生成等核心目标,主导端到端模型的技术与范式革新,实现多任务的多场景泛化能力。
2、参与机器人多模态大模型的全生命周期开发,包括模型架构设计、训练(结合预训练、强化学习、模仿学习等方法)、部署(边缘/云端)及测评(覆盖任务成功率、泛化性、鲁棒性等),协同团队构建统一的机器人智能算法框架。
3、与机械控制、传感器、数据工程等上下游团队协同,推动机器人数据集、仿真环境、硬件平台等项目的研发和迭代;
4、跟踪顶会(如RSS、ICRA、NeurIPS等)及产业界技术动态,复现、创新前沿方法(如VLM、VLA、世界模型等),推动技术专利与高水平论文产出,提升团队在机器人多模态领域的学术影响力。
职位要求:
1、背景:硕士及以上学历,机器人工程、计算机、人工智能、机器学习、应用数学等相关专业;具备扎实的理论、算法和机器学习基础;
2、技术能力:
– 熟悉机器人大模型核心技术(如VLM视觉-语言模型、VLA视觉-语言-动作模型),掌握机器人领域前沿算法(如Diffusion Policy、PI系列、RT系列等)的原理与实践;
– 具备大模型训练与调优经验(如多模态预训练、指令微调、强化学习对齐等),从数据处理到模型部署的全流程研发;
– 熟练使用PyTorch等框架,掌握分布式训练、模型压缩等工程优化技术,熟悉Git协作规范。
3、作为核心作者在机器人/多模态/AI顶会(RSS、ICRA、CVPR、NeurIPS、ICLR、ACL等)发表过论文者优先;有机器人仿真或真实机器人操作经验者优先。
4、优秀的逻辑分析与问题解决能力,具备跨团队沟通协作意识,对机器人智能领域有强烈探索欲,能快速学习并适应技术迭代。
招聘部门:
小米
工作地点:
北京市 ID:A41979
面试建议:
面试小米的机器人多模态大模型研究专家职位,你需要展现出对机器人多模态大模型技术的深刻理解和实践经验。这个职位不仅要求你具备扎实的理论基础和算法能力,还需要你在实际项目中展示出对大模型训练、调优和部署的全流程掌握。面试官会特别关注你在机器人多模态感知、移动操作和运动轨迹生成等方面的技术深度,以及你在顶会论文或实际项目中的表现。 建议你在面试前重点准备以下几个方面:首先,确保你对VLM、VLA等核心技术的原理和应用场景有清晰的理解,并能用实际案例说明你的经验。其次,准备好讨论你在多模态预训练、指令微调、强化学习对齐等方面的具体工作,包括遇到的挑战和解决方案。最后,展示你的跨团队协作能力和对机器人智能领域的热情,这将帮助你在面试中脱颖而出。
在线咨询
请输入您的问题:
提示:由 AI 生成回答,可能存在错误,请注意甄别。