摘要
本申请公开了一种文档比对方法、装置和电子设备,属于电子文档处理领域。所述方法包括:分别构建第一文档对应的第一图结构,和第二文档对应的第二图结构;第一图结构和第二图结构分别用于表征相应的第一文档和第二文档中文档元素的元素位置特征、元素层级关系和位置相似差;确定第一图结构的第一图特征,和第二图结构的第二图特征;获取第一文档对应的第一文本特征和第二文档对应的第二文本特征;根据第一图特征、第二图特征、第一文本特征以及第二文本特征,获得第一文档和第二文档之间的相似度,融合了文档元素本身的文本特征和结构特征来确定两个文档之间的相似度,丰富了相似性评估的维度,实现更加准确、全面地确定两个文档之间的相似度。
技术关键词
文档比对方法
文本
元素
神经网络模型
层级
图片
表格
表达式
电子设备
比对装置
自然语言
处理器
模块
关系
存储器
标签
程序
系统为您推荐了相关专利信息
正弦波
无刷电机控制方法
无刷电机控制系统
编码特征
语义
标志物
数据训练神经网络
药效学指标
检验方法
数据处理系统
声波时差
高斯混合模型
高斯分布模型
混合聚类算法
GMM模型