一种用于Transformer模型的集成压缩方法及系统

AITNT
正文
推荐专利
一种用于Transformer模型的集成压缩方法及系统
申请号:CN202410811689
申请日期:2024-06-21
公开号:CN118839727A
公开日期:2024-10-25
类型:发明专利
摘要
本发明属于语言模型压缩技术领域,提供了一种用于Transformer模型的集成压缩方法及系统,包括获取输入语料,并将输入语料预处理为嵌入矩阵;利用线性评分函数为每个嵌入向量分配得分;将嵌入向量按照得分降序排列后以特定的形式配对放入锦标赛中,将每一次配对后的嵌入向量融合生成新嵌入向量和得分,参与下一次的配对,并确保嵌入向量在传递到下一次时保持相对位置不变,最终得到k个嵌入向量。本发明通过动态调整模型各层的标记表示,突破了传统技术的静态限制,提高了模型的性能和训练速度。
技术关键词
语言模型压缩技术 压缩系统 数据获取模块 处理器 线性 融合方法 程序 矩阵 存储器 注意力 电子设备 索引 列表 标记 动态 介质 网络 参数 速度
系统为您推荐了相关专利信息
1
一种下肢康复动态智能固定装置
智能固定装置 中心控制器 刺激系统 脚部 融合处理器
2
一种任意点的气象灾害预警识别方法、装置及设备
气象灾害预警 空间插值算法 预报误差 气象预报数据 高时空分辨率
3
一种充电枪漏液监测系统及充电枪
监测系统 电阻值 检测芯片 数据获取模块 风速
4
基于图匹配的目标追踪方法、装置、设备及介质
加权随机游走 追踪方法 二值化图像 矩阵 节点
5
基于CTL时序逻辑公式的反例分析及可视化方法、介质及设备
可视化方法 时序 逻辑 变量 解析器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号