一种基于宽度学习的自然语言理解模型训练方法及系统

正文

推荐专利

申请号：CN202510778670

申请日期：2025-06-11

公开号：CN120893517A

公开日期：2025-11-04

类型：发明专利

摘要

本发明公开了一种基于宽度学习的自然语言理解模型训练方法及系统，包括以下步骤：对训练数据进行预处理；将基于Transformer架构的预训练语言模型与宽度学习融合，得到融合模型；将训练数据作为基于Transformer架构的预训练语言模型的输入，利用BLS的岭回归学习机制，根据所适配的自然语言理解任务的标签，得到相应的BLS的学习评估结果；根据适配结果制定相应的自适应层冻结策略确定预冻结层。根据预冻结层、适配任务的复杂度以及当前计算资源，通过层冻结参数高效微调策略确定最终的冻结层，在未冻结层上加入参数高效微调模块，以引入的额外可训练参数实现冻结微调，得到相应微调数据对应下游任务的垂域模型。

技术关键词

自然语言理解模型前馈神经网络预训练语言模型输出特征参数注意力策略模块数据序列标签处理器机制可读存储介质复杂度元素存储器

系统为您推荐了相关专利信息

边缘设备下基于表征驱动头部聚类的联邦学习方法

客户端联邦学习方法中心服务器原型数据分布

一种新型多孔微通道换热器及其优化设计方法

微通道换热器优化设计方法介质参数粒子群优化算法

一种双目标旋转散热流道结构优化设计方法

三维模型结构旋转散热结构多孔介质材料优化设计方法流道结构

多孔介质表面扁平型水下航行体一体化减阻设计方法

水下航行体减阻设计方法扁平型翼型迭代算法

使用机器学习进行图像重光照

图像生成模型光照图像嵌入颜色对象

一种基于宽度学习的自然语言理解模型训练方法及系统

站点导航

APP 下载