摘要
本发明提供一种面向Transformer神经网络模型的模块化分解方法,对于一个随机初始化的模型进行模块化训练,以及在模块化训练后应用掩码实现结构化分解,从而实现灵活的按需复用;具体包括以下步骤:S1、模块化训练;给定一个神经网络模型,首先将模型的全部参数随机初始化;包含一个神经元识别器,用来识别与特定功能相关的神经元;S2、结构化分解;对于模块化训练的模型,将对其进行模块化分解;S3、按需复用;通过结构化地移除神经元,来实现按需复用,最小化内存与计算开销。本发明可以实现Transformer结构模型的结构化分解与功能的灵活按需复用,有高度的可拓展性。
技术关键词
神经网络模型
识别器
样本
线性
矩阵
梯度下降算法
注意力
代表
模块
数据
内存
概念
参数
指标
定义
噪声
编码
关系
系统为您推荐了相关专利信息
虚拟夹具
机器人辅助系统
动态系统模型
机器人状态信息
手环
图表
自动评估方法
文本
大语言模型
视觉障碍用户
桥墩水下检测
深度学习方法
深度学习网络模型
编码
测点布置方法
动态辨识方法
表达式
机器人末端执行器
轨迹
参数
异构
服务器
指令转换模块
性能指标数据
弹性伸缩策略