一种大语言模型的文档检索增强方法、装置及设备

正文

推荐专利

申请号：CN202510055368

申请日期：2025-01-14

公开号：CN119938884A

公开日期：2025-05-06

类型：发明专利

摘要

本申请提供一种大语言模型的文档检索增强方法、装置及设备。该方法包括：对于每一原始文本，将原始文本的起始位置作为起点，按照文本的文字顺序查找文本切分符号，根据起点和文本切分符号，基于预设启发式规则与滑动窗口进行文本分割，得到满足文本长度范围的多个文本块；获取原始文本中的所有字号，生成原始文本对应的文档目录结构；将原始文本对应的文档目录结构和对应的各个文本块的向量化文本片段存储到向量数据库中；召回与用户输入最相关的topK个召回文本片段；针对每一召回文本片段，根据对应的文档目录结构，获取召回文本片段的同一级别或更高级别对应的向量化文本片段，得到满足召回文本长度范围的召回长文本。

技术关键词

文本目录启发式规则大语言模型滑动窗口符号单层通信接口标签可读存储介质关系存储器计算机程序产品处理器指令计算机设备存储模块终端

系统为您推荐了相关专利信息

一种用于拓片图像编号识别与区域匹配方法和装置

区域匹配方法图像区域匹配装置计算机可执行指令神经网络模型

用于业务处理的方法、装置、设备和存储介质

页面大语言模型计算机可执行指令处理单元元素

一种便携式多通道脑电信号处理及睡眠监测方法和系统

多通道脑电信号便携式多通道脑电信号处理睡眠监测方法时间滑动窗口

发送邮件的方法、装置、设备、存储介质及程序产品

邮件传输协议指令格式超文本传输协议状态机模型

一种基于多模态多任务学习的机器人分类检测方法及系统

分类检测方法语义注意力多模态机器人多任务

一种大语言模型的文档检索增强方法、装置及设备

站点导航

APP 下载