摘要
本申请实施例提供一种文本相似度确定方法、装置、设备、存储介质及程序产品,涉及大数据领域。该方法包括:对第一文本和第二文本进行摘要提取处理,得到第一文本的第一摘要,以及第二文本的第二摘要;对第一文本、第二文本、第一摘要和第二摘要分别进行文本指纹提取处理,得到第一文本的第一指纹、第二文本的第二指纹、第一摘要的第三指纹和第二摘要的第四指纹;根据第一指纹和第二指纹确定第一相似度,以及根据第三指纹和第四指纹确定第二相似度;根据第一相似度和第二相似度,确定第一文本和第二文本之间的文本相似度。本申请实施例提供的方法,提高了文本相似度计算的准确度。
技术关键词
关键词
文本
加权词向量
指纹
摘要
计算机执行指令
权重算法
标识
元素
数字串
矩阵
可读存储介质
计算机程序产品
处理器通信
存储器
模块
大数据
数值