摘要
本公开涉及人工智能技术领域,提出一种应用低比特位宽与动态参数初始化模型训练方法,包括:获取目标生长阶段对应的参数规模;基于目标生长阶段对应的参数规模,在目标生长阶段的前一生长阶段训练好的模型基础上扩展参数规模;扩展参数规模后的模型中一个或多个参数采用低比特位宽进行量化;对扩展参数规模后的模型进行训练,并在训练过程中调用第一精度计算核处理激活矩阵与权重矩阵之间的运算,得到目标生长阶段训练好的模型;其中,目标生长阶段训练好的模型用于执行推理任务时,将调用第二精度计算核处理激活矩阵与权重矩阵之间的运算。通过本公开,节省了模型训练的成本,降低了对部署资源的限制,降低了硬件调度复杂度。
技术关键词
阶段
规模
矩阵
参数
机器学习模型
模型训练方法
非易失性计算机可读存储介质
精度
通道
模型训练装置
注意力
比特数
人工智能技术
扩展模块
数值
动态
处理器
基础
存储器
复杂度
系统为您推荐了相关专利信息
Stackelberg博弈模型
交通优化方法
SAC算法
智能车
深度强化学习算法
动态经济调度方法
数学模型
充放电功率
电池充电状态
位置更新