一种基于宽度学习的自然语言理解模型训练方法及系统

AITNT
正文
推荐专利
一种基于宽度学习的自然语言理解模型训练方法及系统
申请号:CN202510778670
申请日期:2025-06-11
公开号:CN120893517A
公开日期:2025-11-04
类型:发明专利
摘要
本发明公开了一种基于宽度学习的自然语言理解模型训练方法及系统,包括以下步骤:对训练数据进行预处理;将基于Transformer架构的预训练语言模型与宽度学习融合,得到融合模型;将训练数据作为基于Transformer架构的预训练语言模型的输入,利用BLS的岭回归学习机制,根据所适配的自然语言理解任务的标签,得到相应的BLS的学习评估结果;根据适配结果制定相应的自适应层冻结策略确定预冻结层。根据预冻结层、适配任务的复杂度以及当前计算资源,通过层冻结参数高效微调策略确定最终的冻结层,在未冻结层上加入参数高效微调模块,以引入的额外可训练参数实现冻结微调,得到相应微调数据对应下游任务的垂域模型。
技术关键词
自然语言理解模型 前馈神经网络 预训练语言模型 输出特征 参数 注意力 策略 模块 数据 序列 标签 处理器 机制 可读存储介质 复杂度 元素 存储器
系统为您推荐了相关专利信息
1
边缘设备下基于表征驱动头部聚类的联邦学习方法
客户端 联邦学习方法 中心服务器 原型 数据分布
2
一种新型多孔微通道换热器及其优化设计方法
微通道换热器 优化设计方法 介质 参数 粒子群优化算法
3
一种双目标旋转散热流道结构优化设计方法
三维模型结构 旋转散热结构 多孔介质材料 优化设计方法 流道结构
4
多孔介质表面扁平型水下航行体一体化减阻设计方法
水下航行体 减阻设计方法 扁平型 翼型 迭代算法
5
使用机器学习进行图像重光照
图像生成模型 光照 图像嵌入 颜色 对象
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号