摘要
本发明属于人工智能技术领域,具体涉及一种基于多源知识融合的检索增强生成方法,通过代理路由系统选择网页、Mock API等多领域知识源,利用稀疏检索、稠密检索和文本重排技术提取相关信息,并结合大语言模型进行实体识别和命名,再采用噪声片段融合技术更新数据。同时,本发明还提出了一种系统及性能验证方法,通过正则匹配和大模型评估生成结果的准确性和一致性。该方法结合了多源数据整合、精准的检索和生成评估,提高了生成内容的准确性、逻辑性和连贯性,适用于多个领域的生成任务。本发明结合了动态知识选择、多步检索与推理以及噪声融合技术,有效提升了检索增强生成模型的整体性能并进行准确评估。
技术关键词
大语言模型
检索策略
数据
生成方法
接口端
接口模块
性能验证方法
文本
检索方法
实体
生成自然语言
生成系统
字符串匹配算法
噪声
标签
分块
重排技术