摘要
本申请涉及长文本对比技术领域,公开了一种长文本对比方法、装置、设备及存储介质,包括:将获取的标板合同文件和待比对合同文件转换为结构化文本,并提取结构化文本的段落序列;基于动态规划算法对标板合同文件和待比对合同文件的段落序列进行分层段落对齐,确定对齐段落对;根据对齐段落对在标板合同文件和待比对合同文件中的未对齐段落中进行差异类型标记,得到第一差异结果;通过预设对比算法对对齐段落对进行字符级最小编辑差异比对,得到第二差异结果;根据第一差异结果和/或第二差异结果确定待比对合同文件和标板合同文件之间的文本对比结果。通过分层段落的精细化比对,能够在不同层次上准确检测差异,确保对齐的全面性和精确性。
技术关键词
文本比对方法
动态规划算法
层级
字符
序列
编辑
补丁
规则集
策略
分层
标记
比对装置
分词
对齐模块
处理器
可读存储介质
报告
系统为您推荐了相关专利信息
灰狼优化算法
序列
云服务器
性能预测方法
计算机程序指令
包装方法
个性化包装
品质监控
支持向量机算法
微生物种类
脱氧血红蛋白
辅助诊断方法
脑成像设备
前额
静息态