职位简介:
作为腾讯CSIG的大模型推理集群优化研发工程师,你将负责大模型推理集群的长期规划与架构设计,构建高可用、高性能的分布式推理基础设施,并参与大模型推理部署平台的建设,包括模型服务管理、发布与升级等核心功能。你需要开发自动化部署工具链,优化PD分离架构下的集群性能,设计流量调度系统和高性能API接口,同时建立完善的监控体系和多租户资源管理方案。该职位要求你精通容器化和Kubernetes技术栈,深入理解LLM推理特性和PD分离架构,并具备大规模分布式系统开发经验,有大模型推理框架或MaaS平台经验者优先。
简历及面试建议:
在准备简历时,你需要重点突出与大模型推理集群相关的技术经验。首先确保简历中包含Kubernetes生产级集群管理的具体案例,比如你曾经管理过的集群规模、解决的问题或实现的优化。对于大模型推理相关的项目经验要详细描述,特别是涉及显存管理、动态批处理或KV Cache优化的实际应用场景。如果你有PD分离架构的实践经验,一定要明确说明你在其中的角色和贡献,包括调度策略、网络通信优化等方面。对于分布式系统开发经验,建议用量化指标来展示你的成就,比如性能提升百分比或资源利用率改善情况。如果有开源大模型推理框架的使用或贡献经历,这也是一个亮点,可以在简历中单独列出。最后,别忘了强调你在团队协作和跨部门沟通方面的能力,因为这个职位需要与多个团队合作推动项目落地。
面试时,面试官会重点关注你对大模型推理技术栈的理解深度和实际解决问题的能力。准备几个你曾经解决过的技术难题案例,最好是与Kubernetes集群管理、大模型推理优化或PD分离架构相关的具体问题。在描述这些案例时,采用STAR法则(情境、任务、行动、结果)来结构化你的回答,并突出你的技术决策过程和量化成果。面试中可能会涉及系统设计题目,比如让你设计一个大模型推理集群的某个子系统,这时候要展示你的架构思维,考虑性能、可用性、扩展性等多方面因素。技术细节方面,准备好讨论显存管理策略、动态批处理实现原理、KV Cache优化方法等话题。对于没有直接经验的技术点,可以展示你的学习能力和快速掌握新技术的方法论。最后,表现出你对大模型技术发展趋势的关注和思考,这会让你在众多候选人中脱颖而出。
在线咨询
提示:由 AI 生成回答,可能存在错误,请注意甄别。