一种基于跨层参数低秩分解的预训练大语言模型的推理优化方法

AITNT
正文
推荐专利
一种基于跨层参数低秩分解的预训练大语言模型的推理优化方法
申请号:CN202510751043
申请日期:2025-06-06
公开号:CN120671829A
公开日期:2025-09-19
类型:发明专利
摘要
本发明属于预训练大语言模型技术领域,具体涉及一种基于跨层参数低秩分解的预训练大语言模型的推理优化方法。包括:S1、获取预训练大语言模型以及校正数据集,收集校正数据推理过程中每一层参数矩阵的特征嵌入X;S2、基于每一层参数矩阵的特征嵌入X,生成特征嵌入的应白化矩阵S;S3、采用白化矩阵S以及其逆矩阵S‑1,对每一层大语言模型的参数矩阵进行白化处理;S4、对白化后大语言模型参数矩阵跨层参数低秩分解,得到优化后的大语言模型。
技术关键词
大语言模型 矩阵 参数 生成特征 校正 核心 系列 数据 行程 元素
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号