摘要
本发明公开了一种融合矛盾特征的文本虚假信息检测方法及系统,其中方法包括:对给定输入文本进行数据预处理,提取文本特征,并提取相似度高于阈值的句子组成相似句子对数据集;基于相似句子对数据集提取给定输入文本中的矛盾词向量特征、矛盾场景特征以及矛盾语义特征;将文本特征、矛盾词向量特征、矛盾场景特征以及矛盾语义特征进行融合,通过自注意力机制进行加权,得到加权分配后的特征融合向量;基于特征融合向量进行虚假信息检测,获取虚假信息检测结果。本发明可融合文本的矛盾特征和风格统计特征进行虚假信息检测,可有效提升基于文本的虚假信息检测的准确性。
技术关键词
虚假信息检测方法
场景特征
注意力机制
文本特征向量
注意力模型
数据
特征提取模块
bert模型
信息检测系统
语句
预训练语言模型
信息检测模块
语义特征提取
协同注意力
词嵌入模型
统计特征
输出特征