一种基于不动点迭代的序列化模型并行训练方法

正文

推荐专利

申请号：CN202510194842

申请日期：2025-02-21

公开号：CN120087439A

公开日期：2025-06-03

类型：发明专利

摘要

本发明公开了一种基于不动点迭代的序列化模型并行训练方法，其特点是采用不动点迭代和Prefix Sums算法，实现线性或非线性序列模型的并行化训练，具体包括：不动点递推公式、并行算法前行传播和梯度反向传播等步骤，所述不动点迭代采用基于不动点得到模型迭代的不动点递推公式，根据序列模型的一般形式，得到线性的递推模型；所述并行前缀和算法采用自适应的并行Prefix Sums算法，自动选择最优的超参数配置，通过反向传播更新模型参数。本发明与现有技术相比具有提高序列化模型训练的效率，不要求模型是线性的，使得系统可以适配更多模型，有效解决了RNN和Neural ODE等序列模型的训练效率受限于时间步之间的顺序依赖性问题，为序列模型的高效训练和应用提供了新的方法。

技术关键词

并行训练方法更新模型参数序列非线性并行算法

系统为您推荐了相关专利信息

一种基于大模型的药物靶点提取方法及系统

药物更新模型参数构建训练集匹配模块登录系统

一种无人船动态避障控制方法

动态避障控制方法非线性模型预测控制无人船多传感器数据融合滚动时域优化

一种基于频率调节的调频单向接地检测系统

接地检测系统 LSTM神经网络接地检测方法调频信号发生器模块

一种电路板生产系统全流程追溯方法

层压界面特征值追溯方法电镀液电路板结构

基于区块链的大规模电子病历访问控制方法

电子病历数据电子病历访问控制方法风险对称加密算法数据存储层级

一种基于不动点迭代的序列化模型并行训练方法

站点导航

APP 下载