摘要
本发明涉及属于检索增强生成(RAG)技术领域,公开了一种基于信息熵的RAG知识库精炼系统及方法;针对现有RAG系统信息过载、效率与精度矛盾、模块割裂等问题,提出基于最小描述长度原理的源头治理机制、轻量化协同架构、价值导向检索策略及全局优化框架四个发明点;通过信息熵量化评估知识价值,筛选最小完备知识子集,实现知识库规模压缩与效能提升,适用于大语言模型知识增强、智能问答等场景,显著提高RAG系统的运行效率与生成质量。
技术关键词
信息熵
文本
概念
核心
精炼系统
检索策略
覆盖率
融合语义
全局优化框架
评估算法
精炼方法
规模
冗余度
动态
效能
模块
密度
参数
系统为您推荐了相关专利信息
虚假信息检测方法
多模态特征融合
信息检测模块
视觉特征
文本
异常数据
随机森林模型
清洗方法
多模型
神经网络模型
信号处理方法
传感器
参数
数据更新
信号处理装置