摘要
本发明公开了基于向量相似搜索的百科条目交叉抵牾检查方法、系统、电子设备及存储介质,包括以下步骤:从百科数据库中提取所有条目的文本内容,将每个条目中的文本内容按照句子进行分割并清洗,得到清洗后句子;利用BERT‑wwm语义模型将清洗后句子转换为向量,得到句子的句子向量表示;利用相似度方法计算每个句子向量表示之间的相似度;设定相似度阈值,当相似度的大小超过相似度阈值时,将对应的句子对作为潜在抵牾,并分析句子对,确定是否存在实际信息的冲突;汇总所有的抵牾句子和相关信息条目,生成详细报告。
技术关键词
条目
检查方法
检查系统
报告
文本
分析模块
电子设备
可读存储介质
语义
处理器
存储器
计算机
措施
程序