摘要
本发明公开了一种基于RAG及大语言模型的信息检索方法及系统,属于智能办公技术领域。本发明方法,包括:采用长短混合粒度法及预设的拆条策略,对不同类型的文档进行解析,以得到针对所述不同类型的文档,长短两种粒度的文本片段,基于所述长短两种粒度的文本片段,构建长短混合粒度知识库;当收到用户问题时,基于大语言模型使用多轮查询重写机制,将所述用户问题调整为具体查询语句;以所述具体查询语句作为检索语句,在所述长短混合粒度知识库中,使用检索增强生成技术RAG进行检索,获取检索结果,并按照检索结果中知识的发布日期,对所述检索结果进行排序,优先展示排序靠前的检索结果。本发明的应用提升了问答检索查询的精确度。
技术关键词
信息检索方法
文本
大语言模型
语句
生成技术
智能办公技术
信息检索系统
层级
数据
策略
日期
机制
处理器
计算机设备
可读存储介质
分段
程序
参数
系统为您推荐了相关专利信息
显示指示标识
文档生成方法
计算机执行指令
参数
图像用户界面
多模态
数据
图形建模方法
网络流量分析
防火墙日志
待测设备
大语言模型
执行交互指令
断言方法
数据处理设备