摘要
本发明公开了一种行为决策模型的训练方法及数字人的自适应交互方法。其中,该训练方法包括:获取样本训练集;使用样本训练集对待训练的行为决策模型进行迭代训练,直到待训练的行为决策模型的目标函数损失值小于预设的损失阈值;其中,目标函数损失值是通过以下得到的:基于待训练的行为决策模型对正样本输出的第一预测行为分布与对负样本输出的第二预测行为分布之间的相对熵,生成对比损失;基于第一预测行为分布与第一目标行为分布之间的均方误差、以及第二预测行为分布与第二目标行为分布之间的均方误差,生成分布对齐损失;基于对比损失和分布对齐损失,生成目标函数损失值。本发明解决了MR场景数字人的行为决策存在不足的技术问题。
技术关键词
加权残差
决策
响应误差
样本
跨模态
场景特征
训练集
非线性
交互方法
深度传感器
环境传感器
数据
视觉传感器
数值
可读存储介质
实时信息
多模态
系统为您推荐了相关专利信息
车辆行驶工况
模型超参数
模型训练方法
字段
样本
机器人控制方法
机器人控制器
机器人自动控制技术
动力系统
机器学习样本
场景
VR头戴式设备
多模态生理
干电极阵列
物体运动轨迹
协方差矩阵
机器学习模型
四维变分同化系统
动态
扰动方法