摘要
本发明涉及人工智能技术领域,提供一种检索增强生成优化方法、系统、设备、产品及介质,包括:获取原始文档,对原始文档进行整理与索引构建得到检索文档;构建混合检索器,通过混合检索器得到第一候选文档;通过第一候选文档生成假设文档,通过混合检索器对检索文档进行二次混合检索得到第二候选文档;计算第二候选文档的信息关联度;对第二候选文档进行筛选得到粗筛选文档;对粗筛选文档进行重组与分段得到分段文档,计算分段文档中单词的关键信息密度分数得到单词的词汇关键信息密度分数;根据细筛选阈值和词汇关键信息密度分数对分段文档进行筛选,得到目标文档。本发明有效提升了检索增强的可靠性和检索质量。
技术关键词
语句
分段
密度
索引
计算机程序产品
序列
词袋模型
大语言模型
人工智能技术
处理器
编码器
指令
格式
模块
可读存储介质
存储器
电子设备
系统为您推荐了相关专利信息
知识迁移方法
数据
平台
特征提取模型
计算机程序指令
数据接口
测试方法
自动化测试系统
噪声功率密度
误码率优化
可变形卷积网络
图像生成模型
多尺度
噪声数据
图像处理方法