腾讯 – 搜索应用部-模型推理工程师 职位分析和面试指导

职位简介:

作为腾讯CSIG搜索应用部的模型推理工程师,核心职责是参与搜索核心业务的模型部署和推理优化工作,包括推理框架核心模块的设计与开发、推理加速方法的工程实现和落地,以及前沿技术的调研和应用。需要精通C++/Go/Python编程语言,熟悉CUDA/OpenCL高性能编程,至少熟练掌握一种推理框架并有二次开发经验,同时熟悉量化、剪枝、动态Shape等优化方法。此外还需具备团队合作和沟通能力,能与团队成员和业务部门紧密协作。

>> 在腾讯官网查看完整职位详情。

简历及面试建议:

在撰写简历时,要特别突出你在模型推理优化方面的实际经验。首先,详细列出你参与过的模型部署项目,特别是那些涉及搜索业务或类似场景的项目。用具体数据说明你的优化工作带来的性能提升,比如推理速度提升百分比或资源使用率降低情况。其次,明确标注你熟悉的推理框架(TensorRT/Triton/vLLM/sglang)和使用程度,特别是如果有二次开发经验一定要强调。对于编程能力部分,不仅要列出熟悉的语言,最好能提供相关项目证明你的CUDA/OpenCL高性能编程经验。最后,团队合作能力不要泛泛而谈,可以用具体案例说明你如何与团队协作完成复杂项目。

面试准备时,要重点准备技术深度和实际案例。技术方面,要能详细解释量化、剪枝、动态Shape等优化方法的原理和适用场景,最好能结合你过去的项目经验来说明。对于推理框架,面试官可能会让你比较不同框架的优缺点,或者针对特定场景选择合适的框架。准备好展示你对CUDA/OpenCL编程的理解,可能会有代码层面的讨论。在行为面试部分,重点准备团队协作相关的案例,特别是跨部门合作解决复杂问题的经历。由于这是腾讯的职位,要了解腾讯搜索业务的特点和挑战,思考如何将你的经验应用到他们的场景中。最后,保持对前沿技术的关注,准备好讨论稀疏化推理、异构推理等新兴技术。

在线咨询

提示:由 AI 生成回答,可能存在错误,请注意甄别。