一种基于低秩张量环分解的多优化目标大模型参数压缩方法

AITNT
正文
推荐专利
一种基于低秩张量环分解的多优化目标大模型参数压缩方法
申请号:CN202510693866
申请日期:2025-05-27
公开号:CN120598046A
公开日期:2025-09-05
类型:发明专利
摘要
本发明公开了一种基于低秩张量环分解的多优化目标大模型参数压缩方法,实现参数的压缩,提高模型的运行效率。利用张量分解计算实现参数的压缩,其方法包括(1)处理输入数据,对Transformer自注意力层的原始权重矩阵进行重塑,得到高维张量其中d1×d2×…×dn=d×d。(2)进行Tensor Ring(TR)分解,利用Tensor Ring(TR)分解将高维张量W分解为N个核心张量,并在在每个核心张量后面加上一个秩控制对角矩阵P。(3)进行联合优化,构造了一种多优化目标的损失优化策略,通过对任务损失、重构误差的综合考虑,实现在模型性能和压缩率之间取得平衡。本发明所采用的联合优化目标策略有效的平衡了任务损失和重构误差,极大的提高了参数压缩后模型的性能。
技术关键词
参数压缩方法 重构误差 矩阵 核心 注意力 重塑方法 分解特征 梯度下降法 数据 策略 强度 索引 变量 环状 样本 算法 元素
系统为您推荐了相关专利信息
1
基于Kcore和深度强化学习的网络瓦解方法及系统
深度强化学习 节点 代表 网络 解码器架构
2
一种使用压缩感知测量多物体振动的部署系统及信号重构方法
信号重构方法 压缩感知技术 信息采集模块 RFID读写器 多物体
3
一种基于分子结构与基因表达的药物IC50预测方法及系统
药物 分子 融合特征 指纹特征 基因调控网络
4
基于区域划分的输变电工程土壤扰动修复方法及装置
输变电工程 仿真模型 修复方法 邻域 土壤特征
5
基于拓扑图匹配的语义辅助视觉SLAM回环检测方法
拓扑图 关键帧 视觉SLAM回环检测方法 节点 矩阵
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号