摘要
本发明实施例提供了一种流匹配生成模型的训练方法、推理方法及相关装置,用于提升训练后的流匹配生成模型所预测的动作序列的准确性。本发明实施例方法包括:获取噪声、时刻t及第一动作的环境特征,第一动作的环境特征至少包括第一动作的观测值;将噪声、时刻t及环境特征输入至初始化的流匹配生成模型,以得到输出的t+1时刻的条件概率路径的预测速度场向量;利用预设的损失函数计算预测速度场向量与真实速度场向量之间的损失,预设的损失函数包括第一损失函数和第二损失函数中的至少一项,以及第三损失函数;利用损失和反向传播算法,对初始化的流匹配生成模型进行训练,直至流匹配生成模型收敛为止,以得到训练后的流匹配生成模型。
技术关键词
推理方法
速度
噪声
传播算法
推理装置
计算机装置
策略
计算机程序产品
处理器
训练装置
可读存储介质
存储器
序列
系统为您推荐了相关专利信息
疲劳检测方法
脑机接口
BP神经网络模型
离散小波变换
原始脑电信号
海上风电塔筒
预警方法
风力发电机组机舱
三维位置信息
数据