基于语义分块的检索方法、系统、电子设备及存储介质

AITNT
正文
推荐专利
基于语义分块的检索方法、系统、电子设备及存储介质
申请号:CN202411740918
申请日期:2024-11-29
公开号:CN119782460A
公开日期:2025-04-08
类型:发明专利
摘要
本发明提供一种基于语义分块的检索方法、系统、电子设备及存储介质,属于人工智能领域。该方法包括:将文本材料分割成句子并编码为向量;计算相邻句子间的余弦相似度,根据相似度阈值确定块边界将属于同一块边界中的多个句子合并为块并编码;利用LLM模型将用户输入查询进行重写,生成相关度评分,将低于评分阈值的块去除获得目标块;利用BM25检索器进行目标块中的关键词检索,将结果与目标块进行重排序组合成上下文,将其与用户查询送入LLM模型生成答案。通过句子分割生成数值向量表示,并计算句子向量间的余弦相似度,能够更准确地识别新话题的开始从而确定块的边界,优化了信息的组织和检索效率,确保了检索结果的准确性。
技术关键词
检索方法 分块 块边界 语义 生成答案 关键词 文本 电子设备 检索系统 解码器 处理器 编码器 话题 存储器 度量 数值 阶段 组织 程序
系统为您推荐了相关专利信息
1
一种数据检索方法、装置、设备及介质
记忆 数据检索方法 主题 数据检索装置 知识图谱构建
2
一种机载复杂电子硬件需求和代码的一致性检测方法
一致性检测 文本 语句 深度学习模型 概念
3
基于语义驱动下的地名时空派生关系网络构建方法及系统
关系网络构建方法 语义 判断方法 构建系统 地理信息技术
4
基于大模型的大规模毁伤效应评估与治理系统
毁伤效应 图像 序列 语义 椒盐噪声
5
一种智能问答方法、装置、设备及介质
智能问答方法 语义 人体姿态数据 序列 多模态
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号