职位简介:
作为腾讯CSIG的元宝-大模型推理加速工程师,你将负责大模型训练和推理系统的研发与性能优化,包括模型计算性能优化、分布式大模型推理系统开发及大规模推理流量调度,并解决系统高并发、高可靠性、高可扩展性等技术难题。同时需要前瞻性地调研和引入技术架构,如子图匹配、编译优化、模型量化等,并与算法部门深度合作进行算法与系统的联合优化。该职位要求熟练掌握Linux环境下的Rust/C++与Python语言,具备大规模机器学习系统相关经验,熟悉主流机器学习框架和大模型训练/推理框架,并具备独立解决问题、团队合作及复杂问题拆解能力。工作地点在深圳。
简历及面试建议:
在撰写简历时,你需要重点突出与大模型推理加速相关的技术经验和项目成果。首先,确保在技能部分明确列出你熟悉的编程语言(Rust/C++/Python)和机器学习框架(TensorFlow/PyTorch等),并具体说明你使用过的大模型训练/推理框架(如vLLM、TensorRT-LLM等)。其次,在项目经历中详细描述你参与过的大模型性能优化项目,包括你负责的具体工作(如计算性能优化、分布式系统设计等)、使用的技术(如模型量化、编译优化等)以及取得的成果(如性能提升百分比、系统稳定性改进等)。如果有开源项目贡献或技术博客,也可以作为加分项列出。最后,强调你的问题解决能力和团队协作经验,用具体案例说明你是如何拆解复杂问题并与团队合作的。
面试时,面试官会重点考察你的技术深度和实际解决问题的能力。准备阶段,你需要复习大模型推理加速的核心技术,包括计算性能优化方法(如算子融合、内存优化等)、分布式推理系统设计(如通信优化、负载均衡等)以及前沿技术(如子图匹配、量化感知训练等)。面试中可能会涉及实际场景的技术方案设计,例如如何优化一个高并发的大模型推理服务,你需要清晰地阐述你的思路和技术选型依据。同时,准备好你在过往项目中遇到的挑战和解决方案,用STAR法则(情境、任务、行动、结果)结构化地回答问题。此外,面试官可能会考察你的学习能力和自驱力,可以提前准备你如何快速掌握新技术或解决陌生问题的例子。最后,保持自信和沟通流畅,展示你对大模型技术的热情和长期发展的规划。
在线咨询
提示:由 AI 生成回答,可能存在错误,请注意甄别。