摘要
本发明公开了一种基于检索增强的生成式语言模型的训练方法、对话生成方法及装置,包括:对原始历史对话进行数据清洗,构建经过预训练的第一大语言模型和第二大语言模型,将清洗后的历史对话输入到第一大语言模型,生成对应的问题描述语句和回复语句;将问题描述语句和回复语句输入到第二大语言模型,生成对应的单条第一知识,再进行数据筛选,得到筛选后的数据;将数据库中检索到的n条第二知识与生成的单条第一知识构成每条高质量历史对话对应的n+1条知识,构建得到混合训练数据;利用混合训练数据训练生成式语言模型。本发明能够解决训练数据获取难度大,现有RAG系统回复不够准确等问题。
技术关键词
大语言模型
语句
对话生成方法
BERT模型
模型训练模块
多层感知机
数据处理模块
处理器
样本
训练装置
存储装置
可读存储介质
程序
电子设备
计算机
系统为您推荐了相关专利信息
滑坡识别方法
数字高程数据
遥感影像数据
图像数据分割
输出特征
训练样本数据
序列
分布式文件系统
索引
计算机可读指令
发电机部件
训练预测模型
故障率预测方法
飞机发电机
故障率预测装置
大语言模型
置信度评估方法
序列
输入模块
处理器
大语言模型
计算机可读指令
答案
序列
文档生成模块