摘要
本发明涉及大语言模型技术领域,公开了一种基于外源知识生成潜力排序增强的对话生成方法,包括:量化不同知识片段的生成潜力,进行矫正和归一化;构建正负样本对进行数据增强;在数据增强的训练集上微调检索器;拼接对话历史和检索器排序后相关性最高的前设定个知识片段,微调生成器;生成器在测试集上推理,返回根据对话历史和召回的知识片段生成的回复。目前主流检索器更多关注到对话历史和外源知识的语义相关性,而非对话历史结合外源知识生成回复标签的能力。本发明在检索器训练中考虑到了这一差异性,使得检索器召回的知识集合能更好地促进生成任务。
技术关键词
对话生成方法
标签
对话生成模型
样本
结构化自然语言
序列
训练语言模型
编码器结构
标记
大语言模型
矫正
话题
数据
数值
训练集
参数
语义
文本
代表
系统为您推荐了相关专利信息
环境感知方法
草坪
特征提取模块
智能割草机器人
静态特征
标签
门限密钥共享
密钥生成算法
签名方法
签名验证算法
输电线路杆塔状态
气象监测数据
预警方法
数字孪生模型
状态报警器