摘要
本申请公开了一种文档对比溯源方法、设备及计算机存储介质,涉及人工智能技术领域,该方法包括:响应于针对差异片段的溯源请求,根据差异片段以及差异片段对应的差异位置,确定差异片段在原始文档中的范围,并识别范围内的文本为目标文本;将目标文本按照分隔符拆分成独立的文本片段,并将文本片段与差异片段进行比对,确定每个文本片段与差异片段之间的相似度;将相似度达到或者超过预设阈值的文本片段作为候选片段,并从候选片段中,确定相似度最高的文本片段作为溯源片段,并返回溯源片段在原始文档中的位置坐标。本申请通过接收差异片段及其差异位置的溯源请求,并定位差异范围,有效缩小了溯源分析范围,提高了文档对比溯源的准确性。
技术关键词
文本
溯源方法
计算机存储介质
字符
溯源设备
坐标
序列
人工智能技术
布局结构
处理器
语义
可读存储介质
存储器
指令
页面
标记
标识
参数
系统为您推荐了相关专利信息
医学图像分割方法
多模型协同
标签
图像编码器
大语言模型
知识图谱构建方法
多语言
多源异构数据
构建知识图谱
关系预测模型