一种基于层次化信息扩充的大语言模型检索增强生成方法

AITNT
正文
推荐专利
一种基于层次化信息扩充的大语言模型检索增强生成方法
申请号:CN202410917879
申请日期:2024-07-09
公开号:CN118779425A
公开日期:2024-10-15
类型:发明专利
摘要
本发明提供了一种基于层次化信息扩充的大语言模型检索增强生成方法,适用于自然语言处理及数据处理领域。本方法利用Markdown格式化器,将传统文档格式转换为包含元信息的Markdown格式,确保内容的结构性和可读性。层次化元信息扩充器采用深度优先搜索对章节元信息进行级联和嵌入,扩充知识块信息并转换为嵌入向量,存储于向量数据库中。多路由检索器结合向量相似度匹配、BM25算法及关键词匹配技术动态检索,优化检索精确性和相关性。本发明能够显著提高在结构相似或内容重复的大规模文档集中的检索效率和答案生成的准确性。本发明的应用为复杂环境下的自然语言处理提供了有效的技术支持,提升了检索增强生成系统的实用性和效果。
技术关键词
生成方法 关键词 滑动窗口技术 深度优先搜索方法 格式化 大语言模型 自然语言 答案 生成文档 检索技术 标记 生成系统 级联 超参数 实体 连续性 算法
系统为您推荐了相关专利信息
1
控制指令的生成方法、装置、电子设备和存储介质
机器人控制指令 自然语言 上下文特征 生成方法 样本
2
一种知识图谱的构建方法、装置、电子设备及存储介质
三元组 文本 关键词 关系 校验模型
3
网络安全事件的知识图谱构建方法、装置、设备以及介质
网络安全事件 网络安全数据 资产 风险 知识图谱构建方法
4
分布式用户参与的大模型训练系统及方法
数据中心 分布式用户 模型训练系统 模型训练方法 训练集
5
乐器N线谱转换方法、推荐指法生成方法及系统
乐器 转换方法 数据采集单元 序列 数据采集模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号