摘要
本发明提供一种基于多维度信息重排序的相似文本检索方法和系统,涉及信息检索技术领域。本发明首先获取待处理的文本,并对文本进行分句,然后通过预先训练的文本关键信息抽取模型和文本概要信息生成模型分别对分句后的文本进行处理,得到两个表征式相似文本检索结果;最后融合这两个表征式相似文本检索结果,得到最终的相似文本检索结果。本发明利用基于多维度信息重排名的方式解决了检索过程中的长文档、准确率低的难题。其中多维度信息包括文本关键信息和文本概要信息,重排名是利用基于位置的份的重排名方式,文本关键信息由文本关键信息抽取模型抽取出来,文本概要信息由文本概要信息生成模型概括生成出来,从而优化了检索质量。
技术关键词
文本检索方法
文本关键信息
文本检索系统
信息抽取模型
信息检索技术
列表
案件
程序
格式
存储器
处理器
标识
电子设备
模块
计算机
代表
系统为您推荐了相关专利信息
人工智能交互
三元组
文本生成方法
预训练语言模型
实体
信息抽取模型
证件
神经网络模型
多模态
大语言模型