职位简介:
作为腾讯CSIG的高性能计算工程师,你将参与基于GPU的高性能计算项目设计与开发,负责GPU芯片的底层性能优化与调优,针对大模型推理、训练等场景优化和扩展vLLM、SGLang等框架的核心模块,提升计算效率与资源利用率。你需要深入分析GPU硬件架构特性,设计并实现高性能算子与算法,与算法训练团队协作解决分布式推理下的性能瓶颈问题,同时探索前沿技术方向推动AI工程化落地效率提升。该职位要求熟悉NVIDIA CUDA/AMD ROCm编程,具备GPU内核优化经验,精通分布式训练框架并有千亿参数模型并行训练实战经验,熟悉大模型训练全流程优化,有DeepSeek系列模型优化经验或相关开源项目贡献者优先。工作地点为上海。
简历及面试建议:
在准备腾讯高性能计算工程师职位的简历时,你需要特别突出GPU性能优化和大型模型训练方面的实际经验。简历中应该详细列出你参与过的GPU优化项目,特别是使用CUDA或ROCm进行底层优化的具体案例,包括优化的指标提升效果。对于分布式训练框架的经验,不要只是简单列出框架名称,而是要说明你在Megatron-LM、DeepSpeed或Colossal-AI等框架上的具体工作,比如实现了哪些优化,解决了什么性能瓶颈问题。如果有参与过千亿参数级别的模型训练项目,务必详细描述你在其中的角色和贡献。开源项目经验是加分项,特别是对vLLM、SGLang等框架的贡献,要提供具体链接和贡献内容说明。技术栈部分要清晰列出你熟悉的Profiling工具和优化技术,如PTX指令调优、显存带宽优化等。教育背景方面,计算机科学、电子工程或相关专业的硕士以上学历会更有竞争力。
面试腾讯高性能计算工程师职位时,你需要做好充分的技术准备。面试官会深入考察你的GPU优化能力,可能会要求你现场分析一个性能瓶颈案例或设计一个优化方案。你需要熟悉常见的GPU性能分析工具如Nsight、rocProfiler等,并能够解释如何通过这些工具定位问题。对于分布式训练框架的问题,要准备好讨论你在模型并行和数据并行方面的实战经验,特别是如何解决通信瓶颈和负载均衡问题。大模型训练全流程优化的知识也很重要,面试官可能会询问你在数据加载、梯度累积、通信压缩等方面的优化策略。技术深度方面,要能够解释Tensor Core的工作原理、显存带宽优化的方法等底层知识。除了技术能力,面试中还会考察你的问题解决思路和团队协作能力,因为这份工作需要与算法团队密切配合。建议准备几个你解决过的复杂性能优化问题的详细案例,使用STAR法则来描述情境、任务、行动和结果。着装方面,技术岗位通常商务休闲即可,但保持专业形象很重要。
在线咨询
提示:由 AI 生成回答,可能存在错误,请注意甄别。