职位描述:
1、深入调研多模态、计算机视觉和自然语言处理等方向的前沿技术
2、推进视觉信息语义分割与编码的研究,设计自监督学习任务,在大数据上训练较大参数规模模型;
3、探索视觉与语言的语义对齐方法,和多模态多任务联合训练
职位要求:
1、硕士及以上学历,计算机、人工智能及机器学习等相关专业;
2、有自然语言处理、计算机视觉、视频理解等技术背景者优先;
3、有大模型预训练、指令微调或强化学习等项目经验者优先;
4、掌握机器学习和深度学习基础知识,熟悉Pytorch、Tensorflow等至少一种深度学习框架,熟悉常用的CV主流网络模型
5、精通Python、C/C++程序设计;
6、有相关方向知名国际会议文章、相关竞赛获奖者优先;
招聘部门:
小米
工作地点:
北京市
面试建议:
小米的多模态算法工程师实习生职位是一个极具挑战性的岗位,它要求应聘者不仅要具备扎实的计算机视觉和自然语言处理基础,更需要掌握这两大领域的交叉融合技术。从职位描述可以看出,这个岗位特别看重候选人在大模型预训练、自监督学习以及多模态语义对齐方面的经验。这些技术点正是当前AI领域最前沿的研究方向,也体现了小米在AI技术布局上的前瞻性。 针对这个岗位的面试准备,我建议重点突出你在多模态领域的项目经验,特别是那些涉及视觉与语言联合建模的实际案例。你需要准备好详细讲解你在模型预训练、微调过程中的技术选型思考和实践心得。同时,由于这是一个研究型岗位,你的论文发表和竞赛经历也会是重要加分项,建议提前整理好相关材料。在技术面试环节,可能会涉及多模态模型的架构设计、损失函数选择等细节问题,建议复习Transformer、CLIP等相关模型的原理和实现。最后,不要忘记准备一些关于小米AI业务布局的了解,这能体现你对公司和岗位的热情。