职位描述:
1、负责机器人多模态大模型的开发,提升机器人对物理世界和人类语言的理解能力,以解决通用场景下的多任务操作问题;
2、优化模型框架和算法组件,利用视觉,语音,本体感知等多模态信息实现在不同应用场景下的功能泛化和长序列动作;
3、深度参与数据构建、模型训练和评测部署,支持模型算法在机器人控制系统中的集成,确保算法的实时性和稳定性;
4、结合生成式AI与多模态技术,探索机器人世界模型在实际场景的落地与应用潜力;
职位要求:
1、机器人、计算机、人工智能等相关领域硕士及以上学历,有大模型在机器人领域应用经验者优先;
2、掌握模仿学习,强化学习等机器学习领域的基础理论和经典算法,熟悉Pytorch或TensorFlow等深度学习框架;
3、熟悉多模态大模型的训练流程,包括数据预处理、预训练、模型调优和验证等,了解常见的增量训练方法与大模型微调方法,有Octo,OpenVLA,GR-2等机器人VLA模型训练部署经验者优先;
4、熟悉Mujoco、Isaac Lab等机器人仿真平台以及ROS框架,扎实的C++或Python编程能力;
5、具有较强的自主学习与研究能力,能够独立解决复杂问题;
招聘部门:
小米
工作地点:
北京市 ID:A16207
面试建议:
这个具身算法工程师职位在小米这样的科技巨头中具有独特的技术挑战。不同于普通的算法岗位,它要求候选人不仅要精通多模态大模型技术,更需要具备将这些技术落地到物理机器人系统的能力。面试官会特别关注你在机器人VLA模型(如Octo/OpenVLA)方面的实战经验,以及如何解决算法从仿真环境到真实机器人的迁移难题。 建议你在准备面试时,重点梳理参与过的机器人多模态项目细节,特别是涉及模型部署和系统集成的部分。准备2-3个能体现你解决’仿真到现实'(Sim2Real)问题的案例,并量化说明算法性能提升的具体指标。对于技术考察,除了复习强化学习和模仿学习的理论基础外,要特别准备ROS框架和Mujoco/Isaac仿真的实操问题。可以预先研究小米近期在机器人领域的技术路线,思考如何将生成式AI与世界模型结合到具体应用场景中。
在线咨询
请输入您的问题:
提示:由 AI 生成回答,可能存在错误,请注意甄别。