摘要
本申请公开了一种基于稳定性边缘的大模型优化加速方法,方法包括:输入用于图像分类的神经网络模型的参数与样本集,通过矩阵特征值计算方法计算神经网络海塞矩阵中高特征值及其对应的特征向量;基于高特征值判断是否使用曲率加速,计算并更新曲率加速矩阵;将曲率加速矩阵作用于动量法的指数移动平均,得到神经网络模型的参数更新值,实现图像分类模型的训练过程的加速。本发明方法能够加速图像分类模型的训练过程,并提升大语言模型在预训练过程中对人类语言的处理效率。
技术关键词
优化加速方法
特征值计算方法
神经网络模型
矩阵
图像分类模型
模型更新
优化加速系统
模块
参数
大语言模型
处理器
动态
指数
样本
可读存储介质
存储器
因子
电子设备
系统为您推荐了相关专利信息
企业内部业务系统
构建分类模型
随机森林
数据分类
会计专业
医学图像配准方法
多模态医学影像
标签
关键点
编码器
多级能源管理系统
储能模块
数据采集单元
光伏发电装置
蓄电池