摘要
本申请涉及一种行业大模型的生成方法、装置、电子设备及存储介质,该方法还包括:利用目标行业的行业数据对第一待训练模型进行训练,得到目标行业对应的行业小模型;将目标行业对应的行业小模型与预设大模型进行组合,并对预设大模型中的模型参数进行冻结,得到第二待训练模型;利用训练数据对第二待训练模型中未冻结的模型参数进行训练,得到目标行业对应的行业大模型,其中,第二待训练模型中未冻结的模型参数的数量小于预设大模型的模型参数的数量,训练数据为目标行业与其他行业的行业数据的混合数据。这样,可以大大降低需要训练的模型参数的数量,从而减少在训练过程中需要占用显卡的数量,并提高训练效率。
技术关键词
参数
数据
生成方法
矩阵
解码信息
解码器
编码器
通信接口
电子设备
适配器
存储器
处理器
注意力
算法模型
生成装置
语句
可读存储介质
文本
系统为您推荐了相关专利信息
交通场景图像
交通违章识别
行车记录仪
车辆跟踪算法
车道
人工智能芯片
机器学习模型
处理器
曲线
计算机程序产品