摘要
本发明属于语言模型压缩技术领域,提供了一种用于Transformer模型的集成压缩方法及系统,包括获取输入语料,并将输入语料预处理为嵌入矩阵;利用线性评分函数为每个嵌入向量分配得分;将嵌入向量按照得分降序排列后以特定的形式配对放入锦标赛中,将每一次配对后的嵌入向量融合生成新嵌入向量和得分,参与下一次的配对,并确保嵌入向量在传递到下一次时保持相对位置不变,最终得到k个嵌入向量。本发明通过动态调整模型各层的标记表示,突破了传统技术的静态限制,提高了模型的性能和训练速度。
技术关键词
语言模型压缩技术
压缩系统
数据获取模块
处理器
线性
融合方法
程序
矩阵
存储器
注意力
电子设备
索引
列表
标记
动态
介质
网络
参数
速度
系统为您推荐了相关专利信息
智能固定装置
中心控制器
刺激系统
脚部
融合处理器
气象灾害预警
空间插值算法
预报误差
气象预报数据
高时空分辨率