摘要
本申请涉及计算机技术领域,尤其是一种数据更新的方法、装置及存储介质。包括:从数据库中获取多个文本数据;从多个文本数据中筛选出满足预设条件的初步候选数据;确定每个初步候选数据与数据库中的所有文本数据之间的语义相似度,并将所有文本数据中语义相似度大于预设值的文本数据确定为最终候选数据;根据初步候选数据和最终候选数据之间的语义相似度确定每个最终候选数据的语义重复惩罚值;根据每个最终候选数据的数据属性和语义重复惩罚值确定每个最终候选数据的得分;根据所有最终候选数据的得分确定出所有最终候选数据中的待移除数据;从数据库中移除待移除数据,能够有效地减少数据计算量,提高计算效率,提升数据库的更新速度。
技术关键词
数据更新
文本
语义
机器可读存储介质
指令
存储器
参数
备份
处理器
速度
系统为您推荐了相关专利信息
自动检测方法
知识图谱路径
多视角图像采集
电力作业场景
知识图谱驱动
索引
计算机可执行指令
网络设备
通信装置
处理器