摘要
本发明提供了一种基于RAG框架的关键字多父级标题召回优化方法及装置,解决了关键字数据库的文本内容不完整,进而导致大语言模型召回准确率差的问题。将过滤处理后的知识文档通过正则表达式分别与一级标题、二级标题、三级标题、文本和文档名称进行匹配,并将匹配结果保存至ES数据库中,用于后续根据各级标题和文档名称以不同权重组装ES数据库的查询条件,通过组装后的查询条件和ES数据库,得到相似度高的上下文,结合上下文和用户的提问,由LLM输出推理结果。解决了ES数据库的文本内容不完整的问题,通过存储更丰富的关联信息提升了LLM召回结果的准确率。
技术关键词
生成查询条件
关键字
文本
框架
可读存储介质
大语言模型
处理器
输出模块
基础
存储器
计算机
电子设备
频率
字符
系统为您推荐了相关专利信息
可视化配置方法
配置页面
层级
格式
权限管理技术
编程阈值电压
陷阱电荷
仿真模型
陷阱机制
FLASH存储器
OCR图像识别技术
平台构建方法
图片
自动化测试环境
模板
图像训练样本
图像分类方法
宽度特征
在线
执行存储器存储