摘要
本发明公开了一种基于张量相似度的深度神经网络模型冻结训练优化方法,本发明参考模型生成模块定期生成单层参考模型以支持实时张量相似度评估;张量相似度计算模块利用激活输出生成归一化Gram矩阵,准确评估活跃层的稳定性;冻结决策模块基于张量相似度的移动平均值,能够平滑评估过程中的瞬时波动,从而作出稳健的冻结决策;张量I/O模块缓存冻结层的前向传播结果,避免重复计算。本发明可有效减少深度神经网络训练过程中反向传播和前向传播的计算量,提高训练过程中的计算资源利用率。本发明在图像分类、目标检测及图像分割等深度神经网络模型训练任务中显著优于现有冻结方法,并在不牺牲模型最终精度的同时提升训练稳定性和效率。
技术关键词
深度神经网络模型
训练优化方法
单层
滑动窗口机制
样本
矩阵
深度神经网络训练
决策
指标
冻结方法
代表
动态
模块
优化装置
输出特征
图像分割
拷贝
处理器
计算机设备
可读存储介质
系统为您推荐了相关专利信息
时间序列预测方法
分块
多层次
滑动窗口机制
多尺度
光学遥感图像
无监督
分类器训练
识别方法
遥感图像特征
风格
样本
主成分分析算法
车辆动力学数据
非线性特征
通信方法
通信系统
深度学习模型
噪声
编码器参数