阿里巴巴 – 未来生活实验室-大模型语音应用算法实习生 职位分析和面试指导

职位描述:

1、设计和研发语音多模态大模型在业务场景的落地方案,负责语音模态业务整体pipeline优化,包括但不限于降噪、声纹、ASR、TTS等;
2、结合大模型Agent技术,优化语音+图片多模态下的real time业务落地交互方案;
3、解决业务落地中的关键技术问题,持续跟进业界语音大模型技术最新进展,加速新技术的引进、适配与优化。

职位要求:

1、计算机科学、人工智能、机器学习等硕士或博士在校生,语音方向优先;
2、对主流的多模态大模型和文本大模型的原理有较为深入的理解,对业界语音大模型应用方案如Astra有较为深入的了解;
3、具备较好的编程能力,动手能力强,熟练使用Java/C/C++和Python,熟练使用至少一种开源深度学习框架;
4、优秀的英文文献阅读能力,有顶会顶刊论文(ICASSP/Interspeech/ACL/EMNLP/CVPR等)发表者优先,ACM竞赛获奖者优先;
5、熟悉语音降噪、声纹识别、语音识别、语音合成等常用音频处理任务,了解常见声学模型和声码器、具有相关算法成果落地经验者优先;
6、有语音+图像多模态大模型落地应用经验者优先。

招聘部门:

阿里巴巴

工作地点:

杭州

注意:为了确保您掌握真实的招聘信息,上述信息均为原始内容。我们的“面试建议”和“模拟面试”均基于原始招聘信息设计和提供。

面试建议:

阿里巴巴的未来生活实验室正在寻找一名大模型语音应用算法实习生,这个职位不仅要求你对语音多模态大模型有深入的理解,还需要你具备将这些技术应用到实际业务场景中的能力。面试官会特别关注你在语音处理技术(如降噪、声纹识别、ASR、TTS)方面的专业知识和实践经验,以及你对多模态大模型技术的掌握程度。此外,如果你有顶会顶刊论文发表或ACM竞赛获奖经历,将会是一个很大的加分项。 为了准备这次面试,建议你重点复习语音多模态大模型的相关知识,特别是Astra等业界主流方案的应用细节。同时,准备好展示你在语音处理任务中的实际项目经验,尤其是那些能够体现你动手能力和问题解决能力的案例。面试中可能会涉及编程能力的考察,所以确保你对Java/C/C++和Python等编程语言的熟练使用,以及对开源深度学习框架的熟悉程度。最后,不要忘记准备一些关于你英文文献阅读能力的例子,因为这也是面试官会关注的一个重点。

在线咨询

提示:由 AI 生成回答,可能存在错误,请注意甄别。