职位描述:
1. 探索多模态大模型的高效训练,包括预训练、SFT、及RLHF等技术;
2. 探索高效的视觉编码器结构、对齐范式、训练策略、数据清洗、质量分级、数据合成等;
3. 探索多模态大模型的逻辑推理、planing、完成复杂任务的能力;
4. 探索原生多模态大模型的架构与训练范式;
5. 探索图像、视频、音频的全模态大模型;
6. 结合淘天业务,推动多模态大模型在搜索、推荐、广告等业务中的应用。
职位要求:
1、计算机视觉、自然语言处理、语音处理、机器学习、数据挖掘、人工智能等相关专业的硕士或博士;
2、具备较好的编程能力,动手能力强,熟练使用至少一种开源深度学习框架;
3、优秀的英文文献阅读能力,有人工智能顶会顶刊论文发表者优先,ACM竞赛获奖者优先。
招聘部门:
阿里巴巴
工作地点:
北京/杭州
注意:为了确保您掌握真实的招聘信息,上述信息均为原始内容。我们的“面试建议”和“模拟面试”均基于原始招聘信息设计和提供。
面试建议:
阿里巴巴未来生活实验室的多模态算法实习生职位是一个极具挑战性的岗位,它要求应聘者不仅具备扎实的算法基础,还需要在多模态领域有深入的理解和实践经验。这个职位最特别的地方在于它不仅仅关注单一模态的研究,而是要求能够处理图像、视频、音频等多种模态的融合与交互。面试官会特别看重你在多模态大模型训练、视觉编码器设计以及复杂任务推理方面的实际经验。 为了准备这个面试,我建议你重点复习多模态大模型的相关知识,特别是预训练、SFT和RLHF等技术细节。同时,准备好你在视觉编码器结构设计方面的项目经验,能够清晰地阐述你的设计思路和实验结果。由于这个职位强调实际应用,你需要特别关注如何将多模态技术应用到搜索、推荐等实际业务场景中。如果你有相关领域的论文发表或竞赛经验,一定要重点准备这部分内容,这将是你的重要加分项。
在线咨询
提示:由 AI 生成回答,可能存在错误,请注意甄别。