工作职责:
1、面向DP、DDP、FSDP、TP、3D并行、流水线并行等模式,在框架或编译器层面进行并行AI程序的性能优化;
2、面向网络首先的AI场景,进行编译器、框架、通信库的联合优化。
3、支持AI框架的其它功能的开发工作。
4、支持面向GPU系统结构的优化。
任职资格:
1、扎实的C/C++设计基础,具有计算机体系结构知识。
2、有机器学习框架开发经验,熟悉PyTorch、TensorFlow、TVM中的一种,有实际开发经验。
3、熟悉并行程序优化的技术,做过并行程序的开发和调试
4、有责任心,良好的沟通协作和分析解决问题的能力。