一种应用低比特位宽与动态参数初始化模型训练方法

AITNT
正文
推荐专利
一种应用低比特位宽与动态参数初始化模型训练方法
申请号:CN202511516665
申请日期:2025-10-23
公开号:CN120975155A
公开日期:2025-11-18
类型:发明专利
摘要
本公开涉及人工智能技术领域,提出一种应用低比特位宽与动态参数初始化模型训练方法,包括:获取目标生长阶段对应的参数规模;基于目标生长阶段对应的参数规模,在目标生长阶段的前一生长阶段训练好的模型基础上扩展参数规模;扩展参数规模后的模型中一个或多个参数采用低比特位宽进行量化;对扩展参数规模后的模型进行训练,并在训练过程中调用第一精度计算核处理激活矩阵与权重矩阵之间的运算,得到目标生长阶段训练好的模型;其中,目标生长阶段训练好的模型用于执行推理任务时,将调用第二精度计算核处理激活矩阵与权重矩阵之间的运算。通过本公开,节省了模型训练的成本,降低了对部署资源的限制,降低了硬件调度复杂度。
技术关键词
阶段 规模 矩阵 参数 机器学习模型 模型训练方法 非易失性计算机可读存储介质 精度 通道 模型训练装置 注意力 比特数 人工智能技术 扩展模块 数值 动态 处理器 基础 存储器 复杂度
系统为您推荐了相关专利信息
1
一种冷阴极触发管电路仿真SPICE模型设计方法
电路仿真 气体放电开关 通道 节点 电流
2
三维视频处理方法、装置、设备和存储介质
解码模型 关键帧 序列 参数 上下文特征
3
基于三层Stackelberg博弈的交通优化方法
Stackelberg博弈模型 交通优化方法 SAC算法 智能车 深度强化学习算法
4
一种电动汽车集成的多目标动态经济调度方法
动态经济调度方法 数学模型 充放电功率 电池充电状态 位置更新
5
工艺优化方法、装置、设备及系统
工艺优化方法 模拟退火算法 参数 随机森林 样本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号