一种基于细粒度早期退出以及动态词表裁剪的预训练大语言模型推理优化方法

AITNT
正文
推荐专利
一种基于细粒度早期退出以及动态词表裁剪的预训练大语言模型推理优化方法
申请号:CN202510750407
申请日期:2025-06-06
公开号:CN120654826A
公开日期:2025-09-16
类型:发明专利
摘要
本发明属于预训练大语言模型技术领域,更具体的说是涉及一种基于细粒度早期退出以及动态词表裁剪的预训练大语言模型推理优化。包括:S1、获取预训练大语言模型以及校准数据集,对预训练大语言模型进行细粒度设置,同时设置置信度估计模块的退出机制;S2、将所述校准数据集输入细粒度设置后的大语言模型进行推理,记录每一注意力层和FFN层的未归一化分数Ll,所述未归一化分数Ll是由注意力子层或FFN子层特征嵌入经过置信度估计模块生成;S3、基于预训练模型预测结果、未归一化分数Ll以及预设的裁剪规模K,计算裁剪起始层p;S4、利用所述裁剪起始层p与裁剪规模K更新置信度评估模块,得到最终预训练模型。
技术关键词
大语言模型 预训练模型 注意力 动态 校准 规模 模块 系列 数据 机制 矩阵 参数 索引 场景 定义
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号