摘要
本发明公开了一种领域自适应的检索增强生成方法及系统,方法包括:通过语义理解模型和文档规则,对文档进行文档解析和语义分块,并存储文档片段;基于大语言模型和预设问题库,生成问题并拆解问题;结合检索技术对初始检索结果进行相关性评估和排序;通过大语言模型筛选出与提示词最匹配的候选内容,并对问题‑检索片段进行打分标注;针对初始检索结果和打分标注结果进行融合构建正负样本,构建有监督数据集;基于预设损失函数,利用有监督数据集对知识语义搜索模型进行有监督训练,对RAG混合搜索模块进行替换,持续迭代。通过本发明的技术方案,能够灵活应用新增领域知识及运营反馈数据,实现领域自适应的检索增强生成。
技术关键词
大语言模型
语义理解模型
生成方法
生成系统
样本
检索技术
搜索模块
分块
数据
表格
图片
系统为您推荐了相关专利信息
感兴趣类别
关系
多尺度特征提取
ResNet网络
矩阵
数据库访问系统
数据库访问方法
上下文管理
生成自然语言
新能源电池
超分辨率图像重建
后处理模块
积层
重建系统
重建超分辨率图像