小米 – 大模型推理部署平台后端研发工程师职位分析和面试指导 – 找大厂工作，用全才测评

职位描述：

1. 负责大模型平台推理部署的架构设计，包括模型部署、推理优化、模型服务高可用、可观测性等;
2. 与业务团队进行沟通和合作，更快落地业务大模型推理部署需求，并持续优化推理性能；
3. 跟踪业内最新的大模型推理部署技术，持续完善推理部署功能和使用体验；

职位要求：

1. 计算机、人工智能等相关专业本科及以上，5年及以上工作经验；
2. 熟练掌握Linux环境下的Go/Python等语言开发和最佳实践, 有解决复杂问题的能；
3. 熟悉Kubernetes架构和生态，熟悉Docker/Operator等云原生技术，有云原生系统开发经验;
4. 有服务端开发经验，熟悉常用组件MySQL、Redis、Nacos、Prometheus等；
5. [加分项]有万级QPS服务端架构设计、分布式架构设计、服务稳定性监控设计经验；
6. [加分项]熟悉常用的推理框架TensorFlow、Triton、TGI、vLLM、SGLang等；

招聘部门：

小米

工作地点：

武汉市 ID：A32259

注意：为了确保您掌握真实的招聘信息，上述信息均为原始内容。我们的“面试建议”和“模拟面试”均基于原始招聘信息设计和提供。

面试建议：

这个职位专注于大模型推理部署平台的后端研发工作，对候选人的要求不仅限于常规的后端开发能力，更强调在大模型推理部署领域的专业经验。面试官会特别关注你在云原生环境下构建高可用、高性能推理服务的实际经验，以及面对复杂技术挑战时的解决能力。建议你在准备面试时，重点梳理过往在模型部署和推理优化方面的项目经验，特别是那些涉及性能调优和稳定性保障的案例。对于云原生技术栈，要准备具体的实现细节和最佳实践。同时，要关注大模型推理领域的最新发展，比如vLLM、SGLang等新兴框架的特点和应用场景。在面试中，面试官可能会通过实际场景题来考察你的系统设计能力，建议提前准备几个典型的大模型推理部署架构设计方案。

在线咨询

提示：由 AI 生成回答，可能存在错误，请注意甄别。

联合国 AI 产品经理培训

UCAM人工智能产品经理证书培训隶属于“联合国可持续发展目标创新及产品管理能力建设项目”，由联合国CIFAL中心和Qgenius合作举办。

网站：联合国可持续发展目创新及产品管理能力建设项目

如您需要改证书考试大纲和课程学习介绍资料（电子版），请填写下面申请表单。

称谓：女士先生

姓名：*

手机：*

邮件：*

地区：

我已阅读并同意网络隐私权保护政策。

注意：所有带*资料均须正确填写。