摘要
本申请涉及一种基于思维链的问答模型训练方法和系统,包括:获取多个问题思维训练样本;将所述多个问题思维训练样本输入至初始思维链模型,根据所述初始思维链模型输出的思维链;将所述思维链输入至问答模型,根据所述问答模型输出的思维答案,得到各个所述思维链的评分;根据所述多个思维链及其评分,采用群体相对策略优化的微调方法,对所述初始思维链模型进行训练,得到目标思维链模型。本申请可以提高思维模型对用户查询的理解,还能显著提高根据思维链输出的答案的准确性,以及答案与问题的相关性。
技术关键词
问答模型训练方法
答案
微调方法
训练系统
生成机制
策略
模块
逻辑
样本
系统为您推荐了相关专利信息
交互系统
信息传递模块
农机
前馈神经网络
注意力机制
问答系统
网络管理
知识图谱管理
答案
数据库查询引擎