基于多维度信息重排序的相似文本检索方法和系统

正文

推荐专利

申请号：CN202510036206

申请日期：2025-01-09

公开号：CN119938883A

公开日期：2025-05-06

类型：发明专利

摘要

本发明提供一种基于多维度信息重排序的相似文本检索方法和系统，涉及信息检索技术领域。本发明首先获取待处理的文本，并对文本进行分句，然后通过预先训练的文本关键信息抽取模型和文本概要信息生成模型分别对分句后的文本进行处理，得到两个表征式相似文本检索结果；最后融合这两个表征式相似文本检索结果，得到最终的相似文本检索结果。本发明利用基于多维度信息重排名的方式解决了检索过程中的长文档、准确率低的难题。其中多维度信息包括文本关键信息和文本概要信息，重排名是利用基于位置的份的重排名方式，文本关键信息由文本关键信息抽取模型抽取出来，文本概要信息由文本概要信息生成模型概括生成出来，从而优化了检索质量。

技术关键词

文本检索方法文本关键信息文本检索系统信息抽取模型信息检索技术列表案件程序格式存储器处理器标识电子设备模块计算机代表

系统为您推荐了相关专利信息

基于大语言模型的智能医患对话术语简化方法及系统

大语言模型术语简化方法命名实体识别患者

一种人工智能交互的法律文本生成方法、系统及设备

人工智能交互三元组文本生成方法预训练语言模型实体

基于上下文信息的实体及实体关系确定方法及信息抽取模型的训练方法

实体信息抽取模型关系标签核心

信息抽取模型的训练方法及装置、存储介质、电子设备

信息抽取模型证件神经网络模型多模态大语言模型

一种基于知识图谱的多模态习题表征方法

图谱表征方法文本关键信息习题图像关系

基于多维度信息重排序的相似文本检索方法和系统

站点导航

APP 下载