职位描述:
1.主导语音合成大模型关键技术:模型结构优化、预训练(ICL)、微调(SFT)、语音后训练等
2.研究音频生成新范式(语音/音效/音乐/歌唱)及跨模态大模型技术,推动技术产品化落地
3.结合强化学习、对抗学习、扩散模型等技术提升生成效果,探索语音多模态联合建模
职位要求:
1.本科及以上学历,语音处理/计算机/数学/AI相关专业
2.五年以上语音合成研发经验,熟悉主流语音合成框架技术栈
3.主导过语音/音乐/多模态生成项目全流程研发
4.精通PyTorch/TensorFlow等深度学习框架,Python/C++工程能力突出
5.有ICASSP、Interspeech等语音顶会论文和竞赛经验者优先
招聘部门:
小米
工作地点:
北京市 ID:A240643
面试建议:
小米的语音合成高级算法工程师职位聚焦于大模型和多模态生成技术的前沿领域。这个岗位最显著的特点是要求候选人不仅要有扎实的语音合成基础,还需要具备将最新AI技术如扩散模型、强化学习等应用于语音生成的能力。面试官会特别关注你在语音合成大模型全流程研发中的实际经验,以及如何将研究成果转化为产品落地的能力。 建议应聘者重点准备以下几个方面的内容:首先,详细梳理你在语音合成项目中的技术贡献,特别是涉及大模型预训练和微调的部分;其次,准备好展示你对扩散模型、强化学习等新兴技术在语音合成中应用的理解;最后,准备一些具体的案例来说明你如何将技术研究成果转化为实际产品。面试中可能会要求你现场分析一些技术难题,所以建议提前复习语音合成领域的最新论文和技术趋势。
在线咨询
请输入您的问题:
提示:由 AI 生成回答,可能存在错误,请注意甄别。