
工作职责:
1、模型部署与优化:参与大模型在不同AI芯片上的推理部署全流程,包括模型移植、性能调优适配;
2、框架适配与开发:负责大模型推理框架在芯片上的适配与优化,如vLLM等;
3、技术研究与跟踪:跟踪LLM前沿技术,如MoE、多模态、长上下文等,跟进业界开源大模型的技术发展,参与合作生态建设,为智算生态发展提供支持;
4、数据处理与分析:协助进行数据收集、清洗、标注和预处理等工作,为模型训练和优化提供高质量数据。参与设计实验,并对实验结果进行分析和评估,为模型优化提供数据支持;
5、文档撰写与沟通:撰写技术文档,记录模型适配、优化过程及结果,输出国产化平台适配与性能优化技术文档。与团队成员保持良好沟通,协同完成模型生态建设相关任务。
任职资格:
1、计算机、软件工程、电子信息、信息安全、控制工程等相关专业,2026届本/硕/博毕业生均可投递;
2、熟练掌握 C/C++ 编程语言,具备良好的 Rust 或其他低级语言的编程能力;
3、熟悉 Linux 或其他操作系统的内核结构和工作原理,有研发实习经验者优先;
4、保持钻研精神,思维敏捷、逻辑能力强、有较好的语言表达能力与沟通技巧,有高度的责任感与责任心,学习能力强。