摘要
本申请公开了一种领域问答大模型训练及问答方法、相关设备及程序产品,涉及自然语言处理技术领域。本申请引入了裁判模型,能够对输入的答案进行偏好打分,评估答案的质量。基于领域知识库提取领域问答数据,在对初始大模型进行迭代训练时由裁判大模型对初始大模型生成的领域问题对应的第一答案,和领域问答数据中的第二答案分别打分,基于打分结果选取满足偏好要求的答案与领域问题组成目标训练数据,利用目标训练数据对初始大模型进行训练,得到最终的领域问答大模型,其采用了高质量的领域问答训练数据进行训练。本申请不需要人工对提取的领域问答数据进行校对即可得到高质量的目标训练数据,节省了人工成本,提高了训练效率。
技术关键词
答案
模型训练方法
问答方法
数据
模型训练装置
计算机程序产品
处理器
自然语言
可读存储介质
处理单元
存储器
电子设备
指令
系统为您推荐了相关专利信息
响应预测方法
多自由度运动
加权特征
序列
海上平台
构件化软件
智能管控方法
中间件
信息综合管理
数据采集单元
高压漏电检测
电流检测模块
切换开关
存储芯片
电源模块