基于信息压缩与剪枝的RAG数据库构建方法

AITNT
正文
推荐专利
基于信息压缩与剪枝的RAG数据库构建方法
申请号:CN202510017185
申请日期:2025-01-06
公开号:CN120045634B
公开日期:2025-10-28
类型:发明专利
摘要
本发明提出了一种信息压缩与剪枝的RAG数据库构建方法,实现步骤为:构建节点对象和层次化聚类树;对聚类树中的节点对象文本信息进行压缩;基于类QR分解方法对部分节点对象文本信息压缩后的聚类树进行剪枝。本发明通过对聚类树中子节点中的句子单元文本信息进行压缩并对所压缩的子节点的嵌入向量进行更新,能够根据大语言模型的实际需求,筛选并存储最有价值的外部信息,这不仅减少了RAG数据库中无效数据存储,还确保RAG数据库中存储的文本信息始终具有增益性,同时基于类QR分解方法对部分节点对象文本信息压缩后的聚类树进行剪枝,有效识别并删除语义相似度较高的冗余子节点对象,减小了RAG数据库中节点对象的存储开销。
技术关键词
节点 文本 数据库构建方法 对象 QR分解方法 大语言模型 语义 聚类 标识符 级联 度量 模板 注意力 更新方法 编码器 线性 数据存储 网络 中子
系统为您推荐了相关专利信息
1
一种用于矿山的风险预警监测系统
汇聚节点 监测设备 预警监测系统 服务器 网关
2
一种基于数字孪生技术的多场景模拟方法及系统
数字孪生技术 场景模拟系统 数字孪生模型 识别成功率 子模块
3
用于提花织物的生产设备控制方法及系统
图片 照片 控制模块 设备控制方法 提花织物
4
基于GCN的城市分级模型的构建方法
GCN模型 超参数 节点特征 Softmax函数 矩阵
5
一种医疗大语言模型的联邦学习系统
大语言模型 投影模型 联邦学习系统 生成对抗网络 编码向量
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号