摘要
本申请提供了文档相似性分析方法、装置、设备、存储介质及产品,该方法包括:对第一文档和第二文档分别进行文本段和图像提取,确定所述第一文档和所述第二文档中的待分析对象,其中,文档中的每一个文本段和每一个图像分别作为一个待分析对象;分别确定所述第一文档和所述第二文档中的各个待分析对象的表征;通过将所述第一文档的各个待分析对象的表征,与所述第二文档的各个待分析对象的表征进行比对,确定相似的待分析对象;通过对所述相似的待分析对象进行基于内容的相似性分析,得到对所述第一文档和所述第二文档的相似性分析结果。根据本申请的技术方案,能够显著提升文档相似度处理效率。
技术关键词
相似性分析方法
对象
文本
图像
哈希算法
处理器
大语言模型
计算机程序产品
分析装置
存储器
分析模块
电子设备
编辑