摘要
本发明一种基于渐进逼近控制的自然语言处理模型训练方法及装置,该方法包括:使用对数屏障函数惩罚约束构造势能函数,以将自然语言处理模型的非凸目标函数转化为多个平滑的近似子问题;使用包含多种词嵌入矩阵的训练集训练自然语言处理模型,在训练过程中基于构造的势能函数采用渐进逼近控制方式控制进行参数更新,直至自然语言处理模型达到收敛状态,得到训练后的自然语言处理模型;渐进逼近控制方式中通过外层循环进行惩罚参数的衰减控制以使得解的轨迹渐进全局极值,以及通过内层循环迭代求解当前势能函数的子问题直至达到收敛状态。本发明具有实现方法简单、模型训练效率以及吞吐量高、内存开销小、训练过程稳定性以及鲁棒性强等优点。
技术关键词
自然语言
模型训练方法
矩阵
异步通信机制
参数优化模型
训练集
模型训练装置
分布式训练
屏障
异步推送
存储计算机程序
词频统计
多层感知机
表达式
序列
极值
处理器
可读存储介质
存储器
系统为您推荐了相关专利信息
磷酸铁锂电池
剩余使用寿命预测
多元时间序列数据
退化模型
深度强化学习
预训练语言模型
槽填充方法
参数
填充系统
数据处理模块
结构优化设计方法
微结构
双尺度结构
水平集函数
数据驱动模型
记忆单元
深度学习算法
LSTM模型
选取特征
长短期记忆网络