摘要
本发明属于文本的近似语义匹配技术领域,具体涉及一种基于深度学习和余弦相似度匹配的规程复述匹配方法及系统。包括如下步骤:步骤1:构建文本的图结构,将文本信息表达为图节点的方式,词汇之间的关系用图的边表示;步骤2:核电专业词汇库的引入;步骤3:语言知识注意力模型对上下文词汇相关性进行建模,迭代更新单词表示和语义表示,并融合彼此的有用信息;步骤4:将词表示融入字符级,利用双边多视角匹配机制对两个字符序列进行匹配,关系分类器将句子向量作为输入,预测两个句子之间的关系。有益效果在于:能够解决人员复述时,复述文本与原规程文本语义相同,词汇不同,难以进行精确匹配的问题。
技术关键词
关系分类器
注意力模型
字符
特征提取模块
语义
数据交互模块
多视角
数据交互关系
决策
词语
文本特征向量
图形用户界面
中文分词
关系建模
序列
系统为您推荐了相关专利信息
特征提取模型
训练特征
字符
特征提取网络
爆破方法
图像鉴别方法
真实图像数据
生成图像数据
深度学习网络
标签
序列标注模型
信息抽取方法
时间序列特征
非暂态计算机可读存储介质
滑动窗口