一种面向大语言模型检索增强的上下文冗余优化方法

正文

推荐专利

申请号：CN202510446708

申请日期：2025-04-10

公开号：CN120994762A

公开日期：2025-11-21

类型：发明专利

摘要

本发明涉及一种面向大语言模型检索增强的上下文冗余优化方法CRORALLM。该方法采用先聚类后摘要的策略优化大语言模型输入上下文，减少冗余影响，提高检索准确性的同时保证内容全面性。CRORALLM首先通过聚类方式对候选文档集进行有序分类，以便更有效识别内容主题，提高后续摘要生成质量；然后使用一个微调的摘要模型根据问题分析聚类文档集的相关性，生成加权摘要作为新的上下文：对与问题相关度高的文本进行保留，对与问题相关度不高的文本进行高程度摘要，对与问题无关的文本则进行过滤。最后将这些上下文用于大语言模型检索增强，以解决信息过载和冗余噪声问题，提高模型回答准确性。实验选取Qwen等四个国内外基座模型，采用公共数据集并设置不同噪声比进行实验，结果表明CRORALLM在不同噪声比下模型准确率均有明显提升，说明该方法能够有效的优化大语言检索增强中的上下文，并提高大语言模型回答的准确率。

技术关键词

大语言模型冗余优化方法噪声鲁棒性生成答案生成文本摘要聚类算法矩阵数据参数有效性基座主题策略因子

系统为您推荐了相关专利信息

一种基于RAG框架的知识库文件上传一致性保障方法及装置

数据框架保障方法大语言模型可读存储介质

基于大语言模型的上下文增强型漏洞检测方法

漏洞检测方法大语言模型摘要静态程序分析分析奠定基础

大语言模型智能体个性化响应生成方法及装置

大语言模型响应生成方法令牌响应生成装置个性化推荐技术

一种基于检索增强生成的软件缺陷复现测试用例生成方法和系统

生成方法生成测试用例测试方法报告大语言模型

一种基于目标存在性的关键帧筛选和视频问答方法、装置及存储介质

视频问答方法关键帧大语言模型视频流图像

一种面向大语言模型检索增强的上下文冗余优化方法

站点导航

APP 下载