职位简介:
作为腾讯云AI研发工程师,核心职责是研发优化AI训练推理场景的通信组件,提升大模型推理性能,包括优化vLLM/SGLang等框架的通信模块,并需要熟练掌握C++/Python编程,熟悉主流大模型推理框架的调优技术如KV Cache优化、PD分离,同时具备并行策略实施能力及GPU/AI芯片编程经验,特别是CUDA和通信算子开发能力。工作地点在深圳。
简历及面试建议:
在准备腾讯云AI研发工程师的简历时,你需要重点突出与大模型推理优化相关的技术能力。首先确保列出所有要求的编程语言(C++/Python)并注明熟练程度,最好能提供GitHub项目链接展示实际代码质量。对于vLLM/SGLang等框架的调优经验要具体说明,比如’通过KV Cache优化将推理延迟降低30%’这样的量化成果会非常吸引面试官。通信组件开发经验要单独列出项目,特别是涉及NCCL/DeepEP的优化工作。如果你有发表过相关论文或专利,一定要放在显眼位置。最后不要忘记强调GPU编程能力,特别是CUDA优化经验,这是腾讯特别看重的核心技术点。
面试腾讯云AI研发岗位时,技术深度是考察重点。准备好详细讲解你在大模型推理优化中的实际项目,面试官会追问技术细节比如’如何解决PD分离时的内存碎片问题’。要提前复习并行计算原理,特别是模型并行的实现难点。对于通信组件的提问,可能会让你在白板上画出NCCL的通信拓扑优化方案。技术轮次之后可能会有系统设计考核,比如’设计一个支持动态批处理的推理服务架构’。建议携带笔记本电脑展示关键项目的代码实现,这能极大增加可信度。最后记得准备1-2个关于腾讯云AI基础设施的前沿问题,这能展现你的行业洞察力。
在线咨询
提示:由 AI 生成回答,可能存在错误,请注意甄别。