小米 – 机器人多模态大模型研究专家职位分析和面试指导 – 找大厂工作，用全才测评

职位描述：

1、深耕机器人多模态大模型，围绕着机器人多模态感知、移动操作和运动轨迹生成等核心目标，主导端到端模型的技术与范式革新，实现多任务的多场景泛化能力。
2、参与机器人多模态大模型的全生命周期开发，包括模型架构设计、训练（结合预训练、强化学习、模仿学习等方法）、部署（边缘/云端）及测评（覆盖任务成功率、泛化性、鲁棒性等），协同团队构建统一的机器人智能算法框架。
3、与机械控制、传感器、数据工程等上下游团队协同，推动机器人数据集、仿真环境、硬件平台等项目的研发和迭代；
4、跟踪顶会（如RSS、ICRA、NeurIPS等）及产业界技术动态，复现、创新前沿方法（如VLM、VLA、世界模型等），推动技术专利与高水平论文产出，提升团队在机器人多模态领域的学术影响力。

职位要求：

1、背景：硕士及以上学历，机器人工程、计算机、人工智能、机器学习、应用数学等相关专业；具备扎实的理论、算法和机器学习基础；
2、技术能力：
– 熟悉机器人大模型核心技术（如VLM视觉-语言模型、VLA视觉-语言-动作模型），掌握机器人领域前沿算法（如Diffusion Policy、PI系列、RT系列等）的原理与实践；
– 具备大模型训练与调优经验（如多模态预训练、指令微调、强化学习对齐等），从数据处理到模型部署的全流程研发；
– 熟练使用PyTorch等框架，掌握分布式训练、模型压缩等工程优化技术，熟悉Git协作规范。
3、作为核心作者在机器人/多模态/AI顶会（RSS、ICRA、CVPR、NeurIPS、ICLR、ACL等）发表过论文者优先；有机器人仿真或真实机器人操作经验者优先。
4、优秀的逻辑分析与问题解决能力，具备跨团队沟通协作意识，对机器人智能领域有强烈探索欲，能快速学习并适应技术迭代。

招聘部门：

小米

工作地点：

北京市 ID：A41979

面试建议：

面试小米的机器人多模态大模型研究专家职位，你需要展现出对机器人多模态大模型技术的深刻理解和实践经验。这个职位不仅要求你具备扎实的理论基础和算法能力，还需要你在实际项目中展示出对大模型训练、调优和部署的全流程掌握。面试官会特别关注你在机器人多模态感知、移动操作和运动轨迹生成等方面的技术深度，以及你在顶会论文或实际项目中的表现。建议你在面试前重点准备以下几个方面：首先，确保你对VLM、VLA等核心技术的原理和应用场景有清晰的理解，并能用实际案例说明你的经验。其次，准备好讨论你在多模态预训练、指令微调、强化学习对齐等方面的具体工作，包括遇到的挑战和解决方案。最后，展示你的跨团队协作能力和对机器人智能领域的热情，这将帮助你在面试中脱颖而出。

在线咨询

请输入您的问题：

提示：由 AI 生成回答，可能存在错误，请注意甄别。