一种基于动态混合检索和邻近段落引入的检索优化方法

AITNT
正文
推荐专利
一种基于动态混合检索和邻近段落引入的检索优化方法
申请号:CN202510722435
申请日期:2025-05-30
公开号:CN120705333A
公开日期:2025-09-26
类型:发明专利
摘要
本发明公开了一种基于动态混合检索和邻近段落引入的检索优化方法,包括:将相关文档作为检索器的语料库;分别利用BM25算法和HyDE算法进行检索,生成对应的初步检索文档段落;将用户查询使用TF‑IDF计算查询特异性值;确定BM25算法和HyDE算法的权重,分别对BM25算法中基于词频统计计算的文档段落相关性得分和HyDE算法中基于语义嵌入相似性计算的文档段落相关性得分加权融合,生成候选文档段落及候选文档段落对应的综合得分;从初步检索文档段落中选取排名靠前的文档段落,并获取其相邻文档段落,计算相邻文档段落的加权分数,并将相邻文档段落加入候选文档段落列表,在列表中选择得分靠前的文档段落作为检索结果。
技术关键词
算法 词频统计 文本 光学字符识别 分割器 词语 动态 解析工具 列表 语句 邻域 格式 语义 分词 算术平均值 检索方法 模板 生成指令 生成用户 分块
系统为您推荐了相关专利信息
1
一种基于排序优化算法的多电商平台订单流转方法及系统
实时状态信息 电商平台订单 流转方法 监控订单 生成订单
2
用于羽绒服防伪控制的智能识别溯源验证系统及方法
羽绒服 防伪标签 防伪识别码 验证系统 电磁干扰噪声
3
一种基于人工智能的物品自动分类方法及系统
物品自动分类 分类物品 图像 注意力机制 池化算法
4
跨系统数据维护方法、装置、设备及存储介质
业务系统数据 跨系统数据 策略 阶段 事务协调器
5
多连通空间实时人数估计方法及系统
人数估计方法 数学模型 通道 工作设备 关系
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号