摘要
本发明公开了一种基于博弈生成对抗网络的知识问答模型训练方法及系统,其包括如下步骤:步骤S1,构建环境角色Critic‑agent、题目生成器Setter‑agent和回答生成器Player‑agent;步骤S2,基于给定知识点和对象,利用大型语言生成模型反向构建问答样本对,形成初始训练集;步骤S3,将环境角色Critic‑agent作为答案质量的判断者,所述环境角色Critic‑agent用于对回答生成器Player‑agent给出的答案进行打分;步骤S4,利用所述题目生成器Setter‑agent出题,与所述回答生成器Player‑agent形成博弈;步骤S5,引入知识蒸馏,基于预训练的大模型向小模型中迁移知识;步骤S6,构建测试集,评估系统效果。本发明可降低样本收集成本、能增强系统泛化能力、可提高系统鲁棒性。
技术关键词
问答模型训练方法
生成对抗网络
答案
知识点
评估系统
蒸馏
样本
对象
训练集
策略
自然语言
指标
鲁棒性
标签
语义
代表
框架
系统为您推荐了相关专利信息
问答模型训练方法
电力
模型训练模块
联合损失函数
关键词
动态评估方法
重构误差
多尺度窗口
编码器
历史运行数据
智能评估系统
智能评估方法
心理状态评估
答题
键盘输入特征
界面
机器学习模型
指令流
交互方法
可缩放矢量图形
人机交互方法
面部特征
智能玩具
机器人本体
美学