一种电子文档差异分析方法、系统、设备及存储介质

正文

推荐专利

申请号：CN202510578849

申请日期：2025-05-07

公开号：CN120087354A

公开日期：2025-06-03

类型：发明专利

摘要

本发明涉及自然语言处理技术领域，公开了一种电子文档差异分析方法、系统、设备及存储介质。该方法包括：通过预设分类模型对待分析文档进行分类和标注得到待分析信息，从待分析信息中提取待分析文本，通过匹配算法将待分析文本和目标文本进行字符匹配得到匹配结果，根据匹配结果确定待分析文本与目标文本的差异字符，并获取差异字符所在差异字段的目标位置信息；差异字符包括待分析文本对应的第一差异字符和目标文本对应的第二差异字符；根据目标位置信息和差异字段，分别在待分析文本和目标文本上生成对应的字段差异批注。本发明可以高效识别出待分析文档和目标文档之间的差异字符，并将差异通过字段的方式进行标注，提高了差异的可读性。

技术关键词

差异分析方法文本字符信息提取模型字段对象表格计算机设备计算机存储介质分词方法电子签章图片分析系统自然语言匹配模块处理器坐标算法存储器

一种电子文档差异分析方法、系统、设备及存储介质

站点导航

APP 下载