职位简介:
作为腾讯云云原生AI Infra研发工程师,核心职责是构建AI大模型在K8s上的高效推理部署体系,包括深度优化计算/网络/存储资源、设计AI专用工作负载、研发推理框架优化方案,并直接对接客户场景实现技术落地。该岗位需要具备5年以上经验,熟练掌握Golang及多种编程语言,深入理解Kubernetes生态及源码机制,同时要求熟悉AI训练推理全流程技术栈,包括主流推理框架、GPU加速技术及分布式训练框架,通过技术手段持续降低推理成本并提升效率。工作地点为深圳或北京。
简历及面试建议:
在撰写简历时,建议采用技术栈矩阵式呈现法,将Kubernetes深度经验与AI推理专长形成交叉展示。重点突出三个维度:在K8s方面详细描述Operator开发经验、源码阅读深度及性能优化案例;在AI领域列举具体参与的推理框架优化项目,注明使用的技术工具链(如vLLM版本号、CUDA优化技巧);在工程能力部分用量化指标展示性能提升成果,比如’通过亲和性调度优化将GPU利用率提升40%’。特别注意要暴露技术决策链思维,例如描述如何平衡triton推理框架选择与客户实际需求的对齐过程。对于非直接相关的项目经验,可提炼底层相通能力,如分布式系统设计思想在AI场景的迁移应用。
面试将重点考察技术场景化能力,建议准备三类素材:首先针对K8s底层机制,要能清晰解释调度器工作原理并举例说明如何定制调度策略满足AI负载需求;其次在AI推理优化方面,需准备完整的问题诊断方法论,比如如何分析一个推理延迟高的case,可能涉及GPU显存管理、RDMA网络调优或批处理策略等多个技术层面;最后要展现工程权衡能力,面试官可能会抛出具体场景如’客户要求同时满足低延迟和高吞吐’,需要展示从技术方案选型到资源配额设计的系统性思考。特别注意腾讯对落地效果的重视,所有技术讨论都要关联到业务价值,例如解释技术方案时同步说明带来的成本下降比例或QPS提升幅度。
在线咨询
提示:由 AI 生成回答,可能存在错误,请注意甄别。