摘要
本发明公开了一种基于检索增强和大语言模型的时效信息问答方法及系统,该方法包括:获取并解析目标文档,将解析后的文本数据上传至数据库;将文本数据的内容作为参考内容上下文,使用大语言模型生成训练数据集;使用训练数据集对Embedding模型进行训练;将文本数据输入训练好的Embedding模型中,得到每个文本数据对应的特征编码,并将特征编码与对应的文本数据相关联;接收用户问题,并转换为用户问题向量,将特征编码与用户问题向量进行相似度比对,选取相似度最高的N个文本数据作为目标数据;将目标数据与用户问题一起输入大语言模型,输出目标答案。本发明可以减少适配成本,增加了整个大语言模型系统的准确性。
技术关键词
信息问答方法
大语言模型
文本
编码
生成训练数据
答案
问答系统
字段
解析单元
处理器
可读存储介质
存储器
计算机
电子设备
文章
指令
列表
参数