小米 – 大模型推理部署平台后端研发工程师 职位分析和面试指导

职位描述:

1. 负责大模型平台推理部署的架构设计,包括模型部署、推理优化、模型服务高可用、可观测性等;
2. 与业务团队进行沟通和合作,更快落地业务大模型推理部署需求,并持续优化推理性能;
3. 跟踪业内最新的大模型推理部署技术,持续完善推理部署功能和使用体验;

职位要求:

1. 计算机、人工智能等相关专业本科及以上,5年及以上工作经验;
2. 熟练掌握Linux环境下的Go/Python等语言开发和最佳实践, 有解决复杂问题的能;
3. 熟悉Kubernetes架构和生态,熟悉Docker/Operator等云原生技术,有云原生系统开发经验;
4. 有服务端开发经验,熟悉常用组件MySQL、Redis、Nacos、Prometheus等;
5. [加分项]有万级QPS服务端架构设计、分布式架构设计、服务稳定性监控设计经验;
6. [加分项]熟悉常用的推理框架TensorFlow、Triton、TGI、vLLM、SGLang等;

招聘部门:

小米

工作地点:

武汉市 ID:A32259

面试建议:

这个职位专注于大模型推理部署平台的后端研发工作,对候选人的要求不仅限于常规的后端开发能力,更强调在大模型推理部署领域的专业经验。面试官会特别关注你在云原生环境下构建高可用、高性能推理服务的实际经验,以及面对复杂技术挑战时的解决能力。 建议你在准备面试时,重点梳理过往在模型部署和推理优化方面的项目经验,特别是那些涉及性能调优和稳定性保障的案例。对于云原生技术栈,要准备具体的实现细节和最佳实践。同时,要关注大模型推理领域的最新发展,比如vLLM、SGLang等新兴框架的特点和应用场景。在面试中,面试官可能会通过实际场景题来考察你的系统设计能力,建议提前准备几个典型的大模型推理部署架构设计方案。

在线咨询


请输入您的问题:

提示:由 AI 生成回答,可能存在错误,请注意甄别。