摘要
本申请涉及一种基于思维链的问答模型训练方法和系统,包括:获取多个问题思维训练样本;将所述多个问题思维训练样本输入至初始思维链模型,根据所述初始思维链模型输出的思维链;将所述思维链输入至问答模型,根据所述问答模型输出的思维答案,得到各个所述思维链的评分;根据所述多个思维链及其评分,采用群体相对策略优化的微调方法,对所述初始思维链模型进行训练,得到目标思维链模型。本申请可以提高思维模型对用户查询的理解,还能显著提高根据思维链输出的答案的准确性,以及答案与问题的相关性。
技术关键词
问答模型训练方法
答案
微调方法
训练系统
生成机制
策略
模块
逻辑
样本
系统为您推荐了相关专利信息
滚动轴承故障诊断
模型训练方法
振动加速度信号
样本
轴承故障诊断系统
智能问答机器人系统
知识库管理
自然语言
数据交互模块
智能问答系统
手术训练系统
训练机器人
触觉反馈手套
心脏模型
图像采集模块