一种面向大语言模型检索增强的上下文冗余优化方法

AITNT
正文
推荐专利
一种面向大语言模型检索增强的上下文冗余优化方法
申请号:CN202510446708
申请日期:2025-04-10
公开号:CN120994762A
公开日期:2025-11-21
类型:发明专利
摘要
本发明涉及一种面向大语言模型检索增强的上下文冗余优化方法CRORALLM。该方法采用先聚类后摘要的策略优化大语言模型输入上下文,减少冗余影响,提高检索准确性的同时保证内容全面性。CRORALLM首先通过聚类方式对候选文档集进行有序分类,以便更有效识别内容主题,提高后续摘要生成质量;然后使用一个微调的摘要模型根据问题分析聚类文档集的相关性,生成加权摘要作为新的上下文:对与问题相关度高的文本进行保留,对与问题相关度不高的文本进行高程度摘要,对与问题无关的文本则进行过滤。最后将这些上下文用于大语言模型检索增强,以解决信息过载和冗余噪声问题,提高模型回答准确性。实验选取Qwen等四个国内外基座模型,采用公共数据集并设置不同噪声比进行实验,结果表明CRORALLM在不同噪声比下模型准确率均有明显提升,说明该方法能够有效的优化大语言检索增强中的上下文,并提高大语言模型回答的准确率。
技术关键词
大语言模型 冗余优化方法 噪声鲁棒性 生成答案 生成文本摘要 聚类算法 矩阵 数据 参数 有效性 基座 主题 策略 因子
系统为您推荐了相关专利信息
1
一种基于RAG框架的知识库文件上传一致性保障方法及装置
数据 框架 保障方法 大语言模型 可读存储介质
2
基于大语言模型的上下文增强型漏洞检测方法
漏洞检测方法 大语言模型 摘要 静态程序分析 分析奠定基础
3
大语言模型智能体个性化响应生成方法及装置
大语言模型 响应生成方法 令牌 响应生成装置 个性化推荐技术
4
一种基于检索增强生成的软件缺陷复现测试用例生成方法和系统
生成方法 生成测试用例 测试方法 报告 大语言模型
5
一种基于目标存在性的关键帧筛选和视频问答方法、装置及存储介质
视频问答方法 关键帧 大语言模型 视频流 图像
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号