摘要
本发明公开了一种基于递归卷积神经网络的中文句子语义相似度计算方法。属于数据挖掘里的数据清洗领域,所述方法基于语义相似度网络模型进行计算,包括:获取句子对数据集,提取数据集中的句子对,得到分词后的文本句子对;提取句子对的初步语义特征和深度语义特征;使用Attention层,根据句子对的深度语义特征生成句子对特征向量的权重;将句子对特征向量的权重输入全连接层,生成句子对的相似度。本发明丰富了词向量的输出内涵,使用自适应池化层更好地反映了原始句子对输入,提升了模型性能表现;设计了Attention层为句子对特征分配相应的权重,使模型聚焦到数据中的关键信息,提取了句子中更直接的语义依赖关系,提升了句子对语义相似度判断的准确率。
技术关键词
递归卷积神经网络
语义特征
度计算方法
双向长短期记忆网络
Softmax函数
高层语义信息
注意力机制
LSTM模型
数据
分词
分类网络
文本
生成方法
模块
编码
动态
图像
系统为您推荐了相关专利信息
输出车载网络
双向长短期记忆网络
注意力机制
异构
多层感知机
度计算方法
语义向量
词语
动态上下文
更新模型参数