腾讯 – 大模型推理优化研发工程师-算子优化/编译-大模型方向 职位分析和面试指导

职位简介:

作为腾讯TEG部门的大模型推理优化研发工程师,你将负责研发及优化大模型推理引擎和PD分离推理调度系统,提升推理性能和框架易用性,并控制成本。你需要熟练掌握C/C++、Python编程语言,具备良好的coding和调试能力,同时熟悉GPU/AI芯片编程如CUDA、OpenCL、Ascend C等,了解cutlass等加速库。此外,你需要熟悉主流大模型推理框架如vllm、sglang、tensorrt-llm、FasterFransformer等,并具备深度学习网络和算子底层实现细节的知识,有训练和推理模型调试、调优经验者优先。你还需熟悉并行策略如模型并行、流水线并行等,了解NVLINK、GPU通信,并具备GPU、AI芯片体系结构知识及系统性能分析和调优经验。工作地点在深圳。

>> 在腾讯官网查看完整职位详情。

简历及面试建议:

在撰写简历时,你需要突出与大模型推理优化相关的技术能力和项目经验。首先,确保你的简历中明确列出你熟练掌握的编程语言,尤其是C/C++和Python,并展示你在这些语言中的实际应用案例。其次,详细描述你在GPU/AI芯片编程方面的经验,如使用CUDA、OpenCL或Ascend C进行优化的项目,如果有使用cutlass等加速库的经验,务必提及。此外,列出你熟悉的大模型推理框架,如vllm、sglang等,并说明你在这些框架上的实际工作成果。如果你有深度学习网络和算子底层实现的经验,或者在模型调试和调优方面的实操经验,这些都是简历中的亮点。最后,不要忘记提及你在并行策略和GPU/AI芯片体系结构方面的知识,这些都是面试官会重点考察的内容。

在面试中,面试官会重点考察你的技术深度和实际解决问题的能力。首先,准备好详细描述你在大模型推理优化方面的项目经验,尤其是那些能够展示你技术深度和实际成果的案例。面试官可能会问你如何优化推理性能或提升框架易用性,因此你需要准备好具体的例子来回答这些问题。其次,面试官可能会考察你对GPU/AI芯片编程的理解,因此你需要熟悉CUDA、OpenCL等编程语言,并能够解释你在这些语言中的实际应用。此外,面试官可能会问你关于深度学习网络和算子底层实现的问题,因此你需要准备好相关的技术细节。最后,面试官可能会考察你对并行策略和GPU/AI芯片体系结构的理解,因此你需要熟悉模型并行、流水线并行等策略,并能够解释你在这些方面的经验。

在线咨询

提示:由 AI 生成回答,可能存在错误,请注意甄别。