基于渐进逼近控制的自然语言处理模型训练方法及装置

正文

推荐专利

申请号：CN202510532012

申请日期：2025-04-25

公开号：CN120494044A

公开日期：2025-08-15

类型：发明专利

摘要

本发明一种基于渐进逼近控制的自然语言处理模型训练方法及装置，该方法包括：使用对数屏障函数惩罚约束构造势能函数，以将自然语言处理模型的非凸目标函数转化为多个平滑的近似子问题；使用包含多种词嵌入矩阵的训练集训练自然语言处理模型，在训练过程中基于构造的势能函数采用渐进逼近控制方式控制进行参数更新，直至自然语言处理模型达到收敛状态，得到训练后的自然语言处理模型；渐进逼近控制方式中通过外层循环进行惩罚参数的衰减控制以使得解的轨迹渐进全局极值，以及通过内层循环迭代求解当前势能函数的子问题直至达到收敛状态。本发明具有实现方法简单、模型训练效率以及吞吐量高、内存开销小、训练过程稳定性以及鲁棒性强等优点。

技术关键词

自然语言模型训练方法矩阵异步通信机制参数优化模型训练集模型训练装置分布式训练屏障异步推送存储计算机程序词频统计多层感知机表达式序列极值处理器可读存储介质存储器

系统为您推荐了相关专利信息

基于复合优化算法的磷酸铁锂电池剩余使用寿命预测方法

磷酸铁锂电池剩余使用寿命预测多元时间序列数据退化模型深度强化学习

一种跨领域对话槽填充方法、系统、设备及存储介质

预训练语言模型槽填充方法参数填充系统数据处理模块

局部放电信号匹配方法、装置、存储介质及电子设备

极值动态时间规整算法矩阵电信号脉冲

一种基于子结构数据驱动的双尺度结构优化设计方法及系统

结构优化设计方法微结构双尺度结构水平集函数数据驱动模型

一种基于高速公路潮汐式污水应急处理的方法及控制系统

记忆单元深度学习算法 LSTM模型选取特征长短期记忆网络

基于渐进逼近控制的自然语言处理模型训练方法及装置

站点导航

APP 下载