摘要
本申请涉及计算机技术领域,具体涉及一种模型训练方法、装置及电子设备,模型训练方法通过获取样本问题、样本问题的多个思维步骤指令、多个思维步骤指令下分别对应的子回复内容以及每个子回复内容的第一概率;由基座模型根据样本问题和样本问题的多个思维步骤指令,顺次预测在各思维步骤指令下输出对应的子回复内容的预测概率;之后,基于子回复内容的预测概率,确定回复生成损失;根据子回复内容的第一概率和预测概率,确定参数更新损失;根据回复生成损失和参数更新损失,更新基座模型的参数;本申请提供的方法,解决了相关技术中自动问答模型针对复杂问题的推理能力较弱的问题。
技术关键词
指令
模型训练方法
基座
训练样本集
参数
分支
模型训练装置
电子设备
可读存储介质
问答模型
计算机程序产品
字符
处理器
模块
语义
存储器
数据
网络
系统为您推荐了相关专利信息
深度强化学习
订单
动态作业
搬运机械臂
排序方法
动态管控方法
DBSCAN聚类算法
策略
系统调用序列
过滤器
教学实训系统
虚拟现实场景
虚拟场景元素
轨迹
仿真场景
信贷风险评估方法
联邦学习模型
模型训练模块
子系统
特征选择