摘要
本申请公开了一种模型训练方法、装置、设备及存储介质。所述方法包括:基于第一对话文本对第一模型进行自回归训练,得到第二模型;通过第二模型,基于第二对话文本中每个词语的上下文,预测每个词语所在位置对应的第一词语概率分布;基于第二对话文本中每个词语、每个词语所在位置对应的第一词语概率分布以及每个词语在预设对话流程中所属的流程节点,确定预设对话流程中待优化的第一流程节点;基于第一对话文本中每个词语在第一对话文本中所属的流程节点,对第一对话文本中不属于第一流程节点的词语进行掩码得到第三对话文本;基于第三对话文本对第二模型进行自回归训练,得到应用于预设对话流程的第三模型。
技术关键词
词语
文本
模型训练方法
节点
电子设备
处理器
模块
可读存储介质
指令
参数
存储器
计算机
系统为您推荐了相关专利信息
蓄冷模块
数据中心机房
节能控制方法
IT机柜
节点
网络节点分类方法
邻居
节点特征
预测社交网络
优化网络参数
重力场模型
球谐系数
深度神经网络
非暂态计算机可读存储介质
数据
专家知识库
大语言模型
人机互动接口
图谱
知识点