职位描述:
参与共建AGI基础设施,支持大规模的人工智能(深度学习)平台,基于领先的400Gbps 的 Infiniband RDMA 网络和最新的 GPU。结合硬件,操作系统等对平台进行深度分析和优化。
岗位职责:
1. 负责基础设施管理,包括资源调度、扩容、监控和优化。
2. 优化和改进监控系统,确保系统的高可用性和性能。
3. 对新技术进行持续的探索研究,提升效率。
职位要求:
1. 本科及以上学历,计算机相关专业优先,扎实的计算机软件基础;
2. 具备较强的 Python/go 等开发能力,扎实的系统化工程能力;
3. 具有自动化实践经验;
4. 具备较好的灵活性、学习迁移能力和对新技术的追求精神,能够从0-1快速学习掌握新技术并解决未遇到过的问题;
5. 硬件极客玩家,硬核操作系统开发者优先;
6. 有良好的团队合作精神和积极主动的沟通意识。
招聘部门:
DeepSeek 运维
工作地点:
浙江·杭州市
面试建议:
这个职位是DeepSeek公司的高级运维开发工程师,主要负责AGI基础设施的建设和优化。最大的特点是需要处理400Gbps的Infiniband RDMA网络和最新GPU集群的管理,这在普通运维岗位中非常少见。面试官会特别关注候选人在超高速网络和AI基础设施方面的实际经验。 建议应聘者重点准备以下几个方面的内容:首先,详细梳理自己在高性能网络优化方面的经验,特别是Infiniband网络相关的案例。其次,准备几个AI平台运维的实际案例,展示你如何解决大规模GPU集群管理中的问题。最后,强调你的自动化开发能力,因为这是日常工作的基础。记得在面试中展现你对新技术的热情和学习能力,这是岗位要求中特别强调的素质。