摘要
本发明公开了一种基于动态混合检索和邻近段落引入的检索优化方法,包括:将相关文档作为检索器的语料库;分别利用BM25算法和HyDE算法进行检索,生成对应的初步检索文档段落;将用户查询使用TF‑IDF计算查询特异性值;确定BM25算法和HyDE算法的权重,分别对BM25算法中基于词频统计计算的文档段落相关性得分和HyDE算法中基于语义嵌入相似性计算的文档段落相关性得分加权融合,生成候选文档段落及候选文档段落对应的综合得分;从初步检索文档段落中选取排名靠前的文档段落,并获取其相邻文档段落,计算相邻文档段落的加权分数,并将相邻文档段落加入候选文档段落列表,在列表中选择得分靠前的文档段落作为检索结果。
技术关键词
算法
词频统计
文本
光学字符识别
分割器
词语
动态
解析工具
列表
语句
邻域
格式
语义
分词
算术平均值
检索方法
模板
生成指令
生成用户
分块
系统为您推荐了相关专利信息
实时状态信息
电商平台订单
流转方法
监控订单
生成订单
羽绒服
防伪标签
防伪识别码
验证系统
电磁干扰噪声
物品自动分类
分类物品
图像
注意力机制
池化算法