摘要
本发明涉及一种面向大语言模型检索增强的上下文冗余优化方法CRORALLM。该方法采用先聚类后摘要的策略优化大语言模型输入上下文,减少冗余影响,提高检索准确性的同时保证内容全面性。CRORALLM首先通过聚类方式对候选文档集进行有序分类,以便更有效识别内容主题,提高后续摘要生成质量;然后使用一个微调的摘要模型根据问题分析聚类文档集的相关性,生成加权摘要作为新的上下文:对与问题相关度高的文本进行保留,对与问题相关度不高的文本进行高程度摘要,对与问题无关的文本则进行过滤。最后将这些上下文用于大语言模型检索增强,以解决信息过载和冗余噪声问题,提高模型回答准确性。实验选取Qwen等四个国内外基座模型,采用公共数据集并设置不同噪声比进行实验,结果表明CRORALLM在不同噪声比下模型准确率均有明显提升,说明该方法能够有效的优化大语言检索增强中的上下文,并提高大语言模型回答的准确率。
技术关键词
大语言模型
冗余优化方法
噪声鲁棒性
生成答案
生成文本摘要
聚类算法
矩阵
数据
参数
有效性
基座
主题
策略
因子
系统为您推荐了相关专利信息
漏洞检测方法
大语言模型
摘要
静态程序分析
分析奠定基础
大语言模型
响应生成方法
令牌
响应生成装置
个性化推荐技术
生成方法
生成测试用例
测试方法
报告
大语言模型