摘要
本发明公开了一种篇章关系识别系统,该系统基于显式篇章关系数据集,构建覆盖多个领域的、自动标注的人造隐式篇章关系数据集,并以该人造隐式篇章关系数据集为训练数据,提取领域共享特征和领域私有特征,从而输出隐式篇章关系识别的预测结果,同时本发明引入了带噪声过滤机制的对抗训练,能够有效缓解伪标签引入的噪声干扰;同时本发明设计了混合专家机制的领域泛化训练,增强了系统对未知目标领域的适应能力,使得本发明在应用于未知目标领域时的识别效果明显好于现有方法,而且本发明在训练时不需要任何人工标注的隐式篇章关系数据,可适用于大多数语言,应用范围更广。
技术关键词
隐式篇章关系
识别系统
特征提取网络
子模块
构建代价函数
启发式规则
表达式
机制
噪声
语义向量
参数
阶段
动态
数据
标签
定义