摘要
本发明涉及自然语言处理技术领域,其公开了一种基于多任务学习的相似性文本意图识别模型训练方法及装置,有效解决高相似性文本的语义歧义问题,提升模型对结构相似但意图不同文本的识别能力。本发明方案中,通过构建语义对抗性训练语料集,利用多重采样策略生成正、负及干扰样本对,设计包含共享编码层的双通道多任务架构,其中第一任务分支通过基于词粒度相似度的对比学习优化语义空间,第二任务分支构建注意力分类网络,再实施分阶段多任务联合训练机制,首阶段用对抗样本提升语义判别力,次阶段结合对比学习与注意力网络提取高混淆样本特征,微调后集成语义向量编码器与分类决策模块,从而获得识别模型。
技术关键词
意图识别模型
多任务联合训练
训练语料集
文本
分类网络
样本
语义向量
对抗性
注意力
预训练语言模型
编码器
分支
决策
阶段
策略
模块
系统为您推荐了相关专利信息
嵌入特征
跨模态
语音特征
梯度下降算法
声学特征
图像识别方法
视觉特征
原型
多层感知机
联合损失函数
大语言模型
多模态数据融合
机器人控制方法
场景
决策
学习路径规划方法
实体
英语口语训练系统
图谱
英语口语学习