
工作职责:
1、模型部署与优化:参与大模型在不同AI芯片上的推理部署全流程,包括模型移植、性能调优适配;
2、框架适配与开发:负责大模型推理框架在芯片上的适配与优化,如vLLM等;
3、技术研究与跟踪:跟踪LLM前沿技术,如MoE、多模态、长上下文等,跟进业界开源大模型的技术发展,参与合作生态建设,为智算生态发展提供支持;
4、数据处理与分析:协助进行数据收集、清洗、标注和预处理等工作,为模型训练和优化提供高质量数据。参与设计实验,并对实验结果进行分析和评估,为模型优化提供数据支持;
5、文档撰写与沟通:撰写技术文档,记录模型适配、优化过程及结果,输出国产化平台适配与性能优化技术文档。与团队成员保持良好沟通,协同完成模型生态建设相关任务。
任职资格:
1、计算机、软件工程、电子信息、信息安全、控制工程等相关专业,2026届本/硕/博毕业生均可投递;
2、热衷于对操作系统内核、虚拟化技术、系统安全等领域深度探索,有高质量论文发表于权威学术期刊,在国内外高水平赛事中获奖;
3、对操作系统技术充满探索欲,主动学习并实践新技术,保持钻研精神;
4、不拘泥于既有技术框架,敢于突破常规提出前瞻性新思路,不断寻求变革与突破。