薪酬
岗位职责
- 负责AI平台训练与推理核心模块的设计与功能实现。
- 参与AI平台的性能优化工作,包括计算资源调度策略设计、PB级高性能存储的存取加速、网络数据并行传输优化等。
- 配合业务团队针对平台功能需求和痛点,进行功能改进与调优工作。
任职要求
- 全日制重点高校本科及以上学历,计算机、软件工程、电子工程、数学等理工科相关专业。
- 熟练使用Python以及C/C++/Golang中至少一门编程语言。
- 熟练掌握 Kubernetes原理并有相关开发经验。
- 能准确定位平台、系统、程序的性能问题,做出针对性改进。
- 熟悉计算机体系结构、数据结构和算法、操作系统、网络等基础原理。
加分项
- 有大规模计算集群的设计、维护、调优经验。
- 深入了解 PyTorch 等训练框架的性能瓶颈分析与性能调优。
- 熟悉InfiniBand与RDMA。
申请方式