一种基于多源检索与总结模块的大语言模型推理增强方法及装置

正文

推荐专利

申请号：CN202510707322

申请日期：2025-05-29

公开号：CN120654815A

公开日期：2025-09-16

类型：发明专利

摘要

本申请涉及一种基于多源检索与总结模块的大语言模型推理增强方法及装置，其包括将Qwen2.5‑32B作为大语言模型，并使用预设的检索数据集对大语言模型进行微调；通过强化学习引入多重奖励来提升大语言模型的自我认知能力；基于FAISS构建向量数据库与实时网络检索系统，并通过向量数据库以及实时网络检索系统多源检索文本数据；通过预设的小型语言模型总结文本数据的文本信息，并将文本信息输出至大语言模型中。本申请采用强化学习(GPRO)对大语言模型的自我认知能力进行提升，并构建多源检索模块，能够做到快速查询语义相近的数据助力大语言模型深入理解数据的语义内涵，提升检索的准确性与合理性。

技术关键词

大语言模型网络检索系统文本蒸馏生成样本数据模块格式预训练模型机制语义鲁棒性训练集定义答案助力标签模板指标

系统为您推荐了相关专利信息

一种基于大模型的漏洞分析方法、程序产品、设备及介质

代码结构漏洞分析方法补丁语义计算机程序产品

异常输入检测模型训练方法、异常输入检测方法

检测模型训练方法输入检测方法剪贴板数据文本警报

双分支订单信息预测方法、计算机装置及存储介质

信息预测方法订单时间预测模型风险评估模型计算机装置

一种用于智能化阶梯补贴发放的方法和系统

联邦学习技术阶梯强化学习框架深度强化学习算法企业

一种基于文本嵌入的岩石冻融损伤深度学习预测方法

深度学习预测指数加权移动平均值超参数非结构化文本信息生成数据集

一种基于多源检索与总结模块的大语言模型推理增强方法及装置

站点导航

APP 下载