基于渐进逼近控制的自然语言处理模型训练方法及装置

AITNT
正文
推荐专利
基于渐进逼近控制的自然语言处理模型训练方法及装置
申请号:CN202510532012
申请日期:2025-04-25
公开号:CN120494044A
公开日期:2025-08-15
类型:发明专利
摘要
本发明一种基于渐进逼近控制的自然语言处理模型训练方法及装置,该方法包括:使用对数屏障函数惩罚约束构造势能函数,以将自然语言处理模型的非凸目标函数转化为多个平滑的近似子问题;使用包含多种词嵌入矩阵的训练集训练自然语言处理模型,在训练过程中基于构造的势能函数采用渐进逼近控制方式控制进行参数更新,直至自然语言处理模型达到收敛状态,得到训练后的自然语言处理模型;渐进逼近控制方式中通过外层循环进行惩罚参数的衰减控制以使得解的轨迹渐进全局极值,以及通过内层循环迭代求解当前势能函数的子问题直至达到收敛状态。本发明具有实现方法简单、模型训练效率以及吞吐量高、内存开销小、训练过程稳定性以及鲁棒性强等优点。
技术关键词
自然语言 模型训练方法 矩阵 异步通信机制 参数优化模型 训练集 模型训练装置 分布式训练 屏障 异步推送 存储计算机程序 词频统计 多层感知机 表达式 序列 极值 处理器 可读存储介质 存储器
系统为您推荐了相关专利信息
1
基于复合优化算法的磷酸铁锂电池剩余使用寿命预测方法
磷酸铁锂电池 剩余使用寿命预测 多元时间序列数据 退化模型 深度强化学习
2
一种跨领域对话槽填充方法、系统、设备及存储介质
预训练语言模型 槽填充方法 参数 填充系统 数据处理模块
3
局部放电信号匹配方法、装置、存储介质及电子设备
极值 动态时间规整算法 矩阵 电信号 脉冲
4
一种基于子结构数据驱动的双尺度结构优化设计方法及系统
结构优化设计方法 微结构 双尺度结构 水平集函数 数据驱动模型
5
一种基于高速公路潮汐式污水应急处理的方法及控制系统
记忆单元 深度学习算法 LSTM模型 选取特征 长短期记忆网络
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号