基于检索增强的生成式语言模型的训练方法、对话生成方法及装置

AITNT
正文
推荐专利
基于检索增强的生成式语言模型的训练方法、对话生成方法及装置
申请号:CN202510101063
申请日期:2025-01-22
公开号:CN120087475A
公开日期:2025-06-03
类型:发明专利
摘要
本发明公开了一种基于检索增强的生成式语言模型的训练方法、对话生成方法及装置,包括:对原始历史对话进行数据清洗,构建经过预训练的第一大语言模型和第二大语言模型,将清洗后的历史对话输入到第一大语言模型,生成对应的问题描述语句和回复语句;将问题描述语句和回复语句输入到第二大语言模型,生成对应的单条第一知识,再进行数据筛选,得到筛选后的数据;将数据库中检索到的n条第二知识与生成的单条第一知识构成每条高质量历史对话对应的n+1条知识,构建得到混合训练数据;利用混合训练数据训练生成式语言模型。本发明能够解决训练数据获取难度大,现有RAG系统回复不够准确等问题。
技术关键词
大语言模型 语句 对话生成方法 BERT模型 模型训练模块 多层感知机 数据处理模块 处理器 样本 训练装置 存储装置 可读存储介质 程序 电子设备 计算机
系统为您推荐了相关专利信息
1
一种滑坡识别方法、系统、设备与介质
滑坡识别方法 数字高程数据 遥感影像数据 图像数据分割 输出特征
2
一种确定训练样本数据的方法、装置、设备及介质
训练样本数据 序列 分布式文件系统 索引 计算机可读指令
3
飞机发电机故障率预测方法、装置、设备及存储介质
发电机部件 训练预测模型 故障率预测方法 飞机发电机 故障率预测装置
4
大语言模型的置信度评估方法、装置、设备及存储介质
大语言模型 置信度评估方法 序列 输入模块 处理器
5
大语言模型提示文本的压缩方法、装置、设备及介质
大语言模型 计算机可读指令 答案 序列 文档生成模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号