摘要
本发明公开了一种基于不动点迭代的序列化模型并行训练方法,其特点是采用不动点迭代和Prefix Sums算法,实现线性或非线性序列模型的并行化训练,具体包括:不动点递推公式、并行算法前行传播和梯度反向传播等步骤,所述不动点迭代采用基于不动点得到模型迭代的不动点递推公式,根据序列模型的一般形式,得到线性的递推模型;所述并行前缀和算法采用自适应的并行Prefix Sums算法,自动选择最优的超参数配置,通过反向传播更新模型参数。本发明与现有技术相比具有提高序列化模型训练的效率,不要求模型是线性的,使得系统可以适配更多模型,有效解决了RNN和Neural ODE等序列模型的训练效率受限于时间步之间的顺序依赖性问题,为序列模型的高效训练和应用提供了新的方法。
技术关键词
并行训练方法
更新模型参数
序列
非线性
并行算法
系统为您推荐了相关专利信息
药物
更新模型参数
构建训练集
匹配模块
登录系统
动态避障控制方法
非线性模型预测控制
无人船
多传感器数据融合
滚动时域优化
接地检测系统
LSTM神经网络
接地检测方法
调频
信号发生器模块
电子病历数据
电子病历访问控制方法
风险
对称加密算法
数据存储层级