腾讯 – 腾讯云-集合通信高级研发工程师 职位分析和面试指导

职位简介:

作为腾讯云集合通信高级研发工程师,你将负责支持腾讯云客户在AI场景中网络和集合通信的性能调优,包括在不同机型上的适配优化,以及集合通信库及配套解决方案的研发优化,以提升腾讯云HCC产品在通信层面的竞争力。该职位要求本科及以上学历,通信、电子、计算机相关专业背景,3年及以上相关工作经验,需熟练掌握Python和C++编程,深入了解DL框架实现原理,熟悉NCCL、MPI等通信库及RDMA协议,具备AI训练场景下的集合通信网络调优经验,有社区开发经验者优先。工作地点为深圳。

>> 在腾讯官网查看完整职位详情。

简历及面试建议:

在撰写简历时,你需要重点突出与AI场景下集合通信性能调优相关的项目经验和技术能力。首先,详细描述你参与过的AI训练项目,特别是那些涉及网络性能调优的部分,包括你使用的具体技术(如NCCL、MPI等通信库)和取得的成果(如性能提升百分比)。其次,强调你对深度学习框架(尤其是Pytorch和Tensorflow)底层实现原理的理解,这可以通过描述你解决过的框架相关问题或进行的优化工作来体现。此外,务必列出你熟悉的网络协议(RDMA和TCP)和编程语言(Python和C++),并举例说明你在这些技术上的实际应用经验。如果你有开源社区贡献经验,一定要单独列出并说明你的具体贡献。最后,用数据量化你的工作成果,比如’通过优化集合通信算法,将AI训练任务的速度提升了30%’这样的表述会让你的简历更具说服力。

面试时,面试官会重点考察你在AI场景下解决集合通信性能问题的实际能力。准备几个你处理过的典型性能调优案例,用STAR法则(情境、任务、行动、结果)清晰地描述问题背景、你的解决思路、采取的具体措施以及最终效果。技术问题可能会涉及RDMA协议细节、verbs编程、通信库调优等方面,复习这些知识点并准备一些常见问题的答案。面试中可能会要求你现场分析一个性能瓶颈问题,所以要熟悉常见的性能分析工具和方法。此外,由于职位强调创新能力,准备好讨论你对未来集合通信技术发展的看法,以及你如何保持技术前瞻性。最后,展现你对腾讯云产品的了解,特别是HCC产品线,这能体现你的求职诚意和行业洞察力。

在线咨询

提示:由 AI 生成回答,可能存在错误,请注意甄别。