职位简介:
作为腾讯云音频语音识别/理解算法高级工程师,你将负责语音识别ASR应用的效果调优与实现,包括多语种语音识别与翻译、端侧轻量级高效ASR落地、目标说话人增强技术及声学/语意VAD等关键任务,同时需要开展ASR-LLM大模型与前沿技术调研与落地工作,如语音与文本对齐、多语种模型方案及弱监督数据筛选流程优化,并持续跟踪复现业界最前沿的音频处理方案。该职位要求硕士及以上学历,声学或信号处理等相关专业背景,具备音频处理领域的深刻理解和声学信号处理数学建模能力,有大模型LLM量化与训练经验、特定人声增强、端到端多语种语音识别等项目经验者优先,熟悉Wenet、K2、Whisper等开源社区方案,熟练使用Python、C、C++等编程语言及Pytorch与Tensorflow框架。
简历及面试建议:
在撰写简历时,你需要重点突出在语音识别和音频处理领域的专业能力和项目经验。首先,确保你的教育背景符合要求,特别是声学或信号处理相关专业的硕士学历。在专业技能部分,详细列出你掌握的编程语言(Python、C、C++)和框架(Pytorch、Tensorflow),并强调你在AI训练与推理方面的熟练程度。项目经验是简历的核心,你需要详细描述参与过的语音识别项目,尤其是多语种语音识别、端侧轻量级ASR实现、目标说话人增强技术等与职位要求直接相关的项目。如果曾在Wenet、K2、Whisper等开源社区贡献过代码或参与过相关比赛,务必突出这些经历,这将大大提升你的竞争力。此外,提及你在ASR-LLM大模型应用和前沿音频处理技术方面的研究或实践经验,展示你对行业趋势的敏锐洞察力。最后,用简洁的语言总结你的职业目标,表达你希望加入腾讯云团队,共同推动语音识别技术发展的强烈意愿。
面试准备时,你需要深入理解腾讯云在语音识别领域的技术方向和应用场景。首先,复习语音识别的基础知识,包括声学模型、语言模型和端到端模型的工作原理,并准备解释你在多语种语音识别和端侧轻量级ASR实现中的具体贡献。面试官可能会考察你对ASR-LLM大模型的理解,因此你需要准备讨论如何将大模型应用于语音识别任务,以及你在语音与文本对齐、多语种模型方案等方面的实践经验。技术问题可能涉及算法优化、模型训练和推理效率提升,因此要准备好相关的技术细节和解决方案。此外,面试官可能会询问你在开源社区的经历,特别是对Wenet、K2、Whisper等项目的贡献,因此要提前回顾这些项目的技术架构和你参与的具体工作。在面试过程中,保持自信和专业,用具体的案例和数据支持你的回答,展示你的技术深度和解决问题的能力。最后,准备一些关于腾讯云语音识别技术发展方向的问题,表现出你对公司和职位的浓厚兴趣。
在线咨询
提示:由 AI 生成回答,可能存在错误,请注意甄别。