一种面向Transformer神经网络模型的模块化分解方法

AITNT
正文
推荐专利
一种面向Transformer神经网络模型的模块化分解方法
申请号:CN202411936055
申请日期:2024-12-26
公开号:CN119886216A
公开日期:2025-04-25
类型:发明专利
摘要
本发明提供一种面向Transformer神经网络模型的模块化分解方法,对于一个随机初始化的模型进行模块化训练,以及在模块化训练后应用掩码实现结构化分解,从而实现灵活的按需复用;具体包括以下步骤:S1、模块化训练;给定一个神经网络模型,首先将模型的全部参数随机初始化;包含一个神经元识别器,用来识别与特定功能相关的神经元;S2、结构化分解;对于模块化训练的模型,将对其进行模块化分解;S3、按需复用;通过结构化地移除神经元,来实现按需复用,最小化内存与计算开销。本发明可以实现Transformer结构模型的结构化分解与功能的灵活按需复用,有高度的可拓展性。
技术关键词
神经网络模型 识别器 样本 线性 矩阵 梯度下降算法 注意力 代表 模块 数据 内存 概念 参数 指标 定义 噪声 编码 关系
系统为您推荐了相关专利信息
1
基于MYO手环和虚拟夹具的遥操作机器人辅助系统及控制方法
虚拟夹具 机器人辅助系统 动态系统模型 机器人状态信息 手环
2
基于大语言模型的图表替代文本质量自动评估方法及系统
图表 自动评估方法 文本 大语言模型 视觉障碍用户
3
一种桥墩水下检测布点方案的深度学习方法
桥墩水下检测 深度学习方法 深度学习网络模型 编码 测点布置方法
4
一种安全激励轨迹下的机器人末端负载动态辨识方法
动态辨识方法 表达式 机器人末端执行器 轨迹 参数
5
一种异构算力的调度方法、装置及可读存储介质
异构 服务器 指令转换模块 性能指标数据 弹性伸缩策略
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号