摘要
本公开提供了一种模型训练方法,涉及人工智能技术领域,尤其涉及大模型技术领域和深度学习技术领域。具体实现方案为:根据预设模型规模信息,确定至少一个模块规模信息;根据至少一个模块规模信息和初始模型的多个初始模块,确定至少一个待训练模块,其中,待训练模块包括根据模块规模信息从初始模块中确定的待训练参数。根据训练样本数据,训练至少一个待训练模块,得到至少一个经训练模块,其中,训练样本数据是由文本样本数据、图像样本数据、音频样本数据和视频样本数据中的至少之一得到的。本公开还提供了一种模型部署方法、装置、电子设备和存储介质。
技术关键词
训练注意力
训练样本数据
规模
模块
参数
模型部署方法
矩阵
模型训练方法
硬件设备
模型训练装置
文本
音频
深度学习技术
电子设备
处理器
视频
人工智能技术