小米 – e2e预研实习生 职位分析和面试指导

职位描述:

1.探索多模态大模型、自监督预训练、世界模型等前沿技术,并应用于自动驾驶场景。

职位要求:

岗位职责:
探索多模态大模型、自监督预训练、世界模型等前沿技术,并应用于自动驾驶场景。
研究方向:
候选人需了解并熟悉以下至少一个方向:
视觉预训练(Visual Pretraining):研究自监督学习、知识蒸馏、大规模数据预训练在视觉任务中的应用,熟悉相关工作如DINOv2等。
多模态学习(VLM/VLA)
Vision-Language-Model(VLM):研究视觉语言大模型,熟悉相关工作如 VARGPT、VPiT、Ross 等。
Vision-Language-Action(VLA):研究视觉语言动作大模型并探索在自动驾驶场景应用,熟悉相关工作如 EMMA等。
世界模型(World Model)
研究基于自监督学习与强化学习结合的端到端世界模型,应用于自动驾驶场景的状态建模、状态转移预测与规划决策。
熟悉相关工作,如 Dreamer 系列、Genie2、Doe-1、JEPA、Cosmos 等。
技术能力要求:
熟悉自监督和生成模型,了解大规模预训练,有经验者优先。
熟练掌握 PyTorch,具备模型开发与优化能力,能够提升训练效率。

招聘部门:

小米

工作地点:

北京市

面试建议:

这个e2e预研实习生的职位专注于将前沿AI技术应用于自动驾驶领域,特别是多模态大模型、自监督预训练和世界模型的研究。面试官会特别关注候选人对这些前沿技术的理解和实践经验。由于这是一个研究型岗位,除了技术能力外,面试官也会考察候选人的学习能力、创新思维和问题解决能力。 建议应聘者重点准备以下几个方面:首先,深入了解职位描述中提到的各个研究方向,特别是自己熟悉的方向,要能清晰阐述相关技术原理和应用场景。其次,准备好展示自己在PyTorch方面的实践经验,包括模型开发和优化的具体案例。最后,思考如何将这些技术应用于自动驾驶场景,准备一些创新性的想法或解决方案。面试时可能会遇到技术深度讨论和实际问题的解决场景,所以要确保对基础知识掌握扎实,同时保持开放的学习态度。