职位描述:
1.参与图像/视频中物体分割算法的研究与实现,包括但不限于主体物分割、实例分割、指定物体分割等;
2.探索并实现业界领先的多模态大模型的图像/视频分割模型;
3.跟进特定领域的行业进展,并结合产品对算法进行优化,使相关产品效果达到业界领先水平;
4.参与学术研究,产出具备行业影响力的科研成果。
职位要求:
1.硕士及以上学历优先,计算机视觉、人工智能、数学或相关专业的在读学生;
2.一定的图像/视频算法实践经验,对图像/视频中物体分割算法相关的深度学习有深入的理解,或有突出的学术成绩;
3.熟悉常见的VLM多模态大模型;熟悉基于多模态大模型的图像/视频分割模型者优先;
4.具备良好的编程能力,熟练掌握Python,熟悉并能灵活运用PyTorch等机器(深度)学习工具解决实际图像/视觉问题者优先;
5.具有较强的内外部沟通能力和协调能力,视野开阔,思维敏捷 ,创新能力强。
招聘部门:
小米
工作地点:
北京市
面试建议:
小米的计算机视觉算法实习生职位聚焦于图像/视频分割领域的前沿技术,特别是多模态大模型的应用。这个职位不仅要求扎实的理论基础,更看重将先进算法落地到实际产品中的能力。面试官会特别关注候选人在物体分割算法和多模态大模型方面的实践经验,以及解决实际问题的能力。 建议应聘者重点准备以下几个方面:首先,要深入理解图像分割领域的最新进展,特别是多模态大模型在分割任务中的应用。其次,准备好展示自己使用PyTorch等工具解决实际问题的项目经验,最好能准备一些可视化的案例。最后,由于职位强调科研成果转化,建议思考如何将学术研究应用到产品中,并准备好相关案例。面试中可能会涉及算法优化、模型部署等实际问题,建议提前了解小米相关产品的技术特点。