一种基于不动点迭代的序列化模型并行训练方法

AITNT
正文
推荐专利
一种基于不动点迭代的序列化模型并行训练方法
申请号:CN202510194842
申请日期:2025-02-21
公开号:CN120087439A
公开日期:2025-06-03
类型:发明专利
摘要
本发明公开了一种基于不动点迭代的序列化模型并行训练方法,其特点是采用不动点迭代和Prefix Sums算法,实现线性或非线性序列模型的并行化训练,具体包括:不动点递推公式、并行算法前行传播和梯度反向传播等步骤,所述不动点迭代采用基于不动点得到模型迭代的不动点递推公式,根据序列模型的一般形式,得到线性的递推模型;所述并行前缀和算法采用自适应的并行Prefix Sums算法,自动选择最优的超参数配置,通过反向传播更新模型参数。本发明与现有技术相比具有提高序列化模型训练的效率,不要求模型是线性的,使得系统可以适配更多模型,有效解决了RNN和Neural ODE等序列模型的训练效率受限于时间步之间的顺序依赖性问题,为序列模型的高效训练和应用提供了新的方法。
技术关键词
并行训练方法 更新模型参数 序列 非线性 并行算法
系统为您推荐了相关专利信息
1
一种基于大模型的药物靶点提取方法及系统
药物 更新模型参数 构建训练集 匹配模块 登录系统
2
一种无人船动态避障控制方法
动态避障控制方法 非线性模型预测控制 无人船 多传感器数据融合 滚动时域优化
3
一种基于频率调节的调频单向接地检测系统
接地检测系统 LSTM神经网络 接地检测方法 调频 信号发生器模块
4
一种电路板生产系统全流程追溯方法
层压界面 特征值 追溯方法 电镀液 电路板结构
5
基于区块链的大规模电子病历访问控制方法
电子病历数据 电子病历访问控制方法 风险 对称加密算法 数据存储层级
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号