职位简介:
作为腾讯云大数据LLMops平台研发工程师,你将负责构建大模型全生命周期管理平台,包括设计自动化数据治理流水线处理多模态数据,开发可视化微调工作台支持高效算法配置,打造智能评估中心集成多维评估体系,并实现高并发推理服务的性能优化。该职位需要3年以上LLM/AI Infra开发经验,精通Python/Go及Kubernetes云原生技术栈,熟悉PyTorch/TensorFlow和HuggingFace生态,具备训练加速或服务优化等专项能力,同时要求持续跟踪LLM领域技术前沿,有编译优化或量化部署经验者将更具竞争力。工作地点可选深圳、北京或杭州。
简历及面试建议:
在准备腾讯云LLMops岗位的简历时,建议重点突出大模型全流程开发经验。不要简单罗列项目,而是用数据量化你的贡献,比如’主导设计的数据治理流水线处理了日均1TB的多模态数据,清洗效率提升40%’。技术栈描述要精确到具体工具版本和应用场景,例如’基于vLLM 0.2.4开发动态批处理模块,将推理吞吐量提升3倍’。特别注意展示跨领域能力组合,比如同时具备训练加速和服务优化的项目经验,这正是该职位区别于普通AI研发岗位的特殊要求。如果有开源贡献或技术博客,务必列出具体链接,这能很好体现技术热情。
面试时将重点考察技术深度和系统思维。准备时要能清晰解释LoRA等算法的数学原理和工程实现差异,面试官可能会要求在白板上推导关键公式。针对高并发场景的设计题要提前练习,比如如何设计流量调度方案应对突发请求。实际编码测试可能涉及用Python实现动态批处理逻辑,或者用Go编写Kubernetes Operator来管理训练任务。回答问题时要展现对LLM技术趋势的理解,比如最近流行的MoE架构对平台设计的影响。遇到场景题建议采用STAR法则回答,重点说明你在过往项目中做出的技术决策及其trade-off分析。
在线咨询
提示:由 AI 生成回答,可能存在错误,请注意甄别。