摘要
本申请实施例提供了一种动作控制方法、动作控制模型的训练方法、装置及设备,涉及人工智能技术领域。该方法包括:从第一视频提取第一视频特征,以及从第一图像提取第一图像特征;根据第一视频特征和第一图像特征,得到初始融合特征;基于频率感知权重,通过扩散神经网络对初始融合特征执行N个阶段的降噪处理,得到最终融合特征,N为正整数;基于最终融合特征,生成包含目标主体的第二视频,目标主体在第二视频中的动作是基于参考主体在第一视频中的动作控制的。扩散神经网络在不同频率下从关注目标主体的空间结构特征转变到关注参考主体的动作特征,以使得得到的最终融合特征中能够包括更多的细节的动作特征。
技术关键词
融合特征
样本
语义特征
动作特征
动作控制方法
阶段
图像
空间结构特征
注意力
频率
输出特征
适配器
文本信息提取
网络
模块
视频帧
空间布局特征
计算机程序产品
系统为您推荐了相关专利信息
识别模型构建方法
像素点
归一化植被指数
遥感影像数据
多波段
Relief算法
样本
因子
随机森林模型
滑坡灾害防治
图像特征向量
三维图像信息
多模态特征
对象
关节点