一种面向Transformer神经网络模型的模块化分解方法

正文

推荐专利

申请号：CN202411936055

申请日期：2024-12-26

公开号：CN119886216A

公开日期：2025-04-25

类型：发明专利

摘要

本发明提供一种面向Transformer神经网络模型的模块化分解方法，对于一个随机初始化的模型进行模块化训练，以及在模块化训练后应用掩码实现结构化分解，从而实现灵活的按需复用；具体包括以下步骤：S1、模块化训练；给定一个神经网络模型，首先将模型的全部参数随机初始化；包含一个神经元识别器，用来识别与特定功能相关的神经元；S2、结构化分解；对于模块化训练的模型，将对其进行模块化分解；S3、按需复用；通过结构化地移除神经元，来实现按需复用，最小化内存与计算开销。本发明可以实现Transformer结构模型的结构化分解与功能的灵活按需复用，有高度的可拓展性。

技术关键词

神经网络模型识别器样本线性矩阵梯度下降算法注意力代表模块数据内存概念参数指标定义噪声编码关系

系统为您推荐了相关专利信息

基于MYO手环和虚拟夹具的遥操作机器人辅助系统及控制方法

虚拟夹具机器人辅助系统动态系统模型机器人状态信息手环

基于大语言模型的图表替代文本质量自动评估方法及系统

图表自动评估方法文本大语言模型视觉障碍用户

一种桥墩水下检测布点方案的深度学习方法

桥墩水下检测深度学习方法深度学习网络模型编码测点布置方法

一种安全激励轨迹下的机器人末端负载动态辨识方法

动态辨识方法表达式机器人末端执行器轨迹参数

一种异构算力的调度方法、装置及可读存储介质

异构服务器指令转换模块性能指标数据弹性伸缩策略

一种面向Transformer神经网络模型的模块化分解方法

站点导航

APP 下载