摘要
本申请提供了一种基于视频扩散模型的机器臂控制方法以及相关设备,包括:从机器臂动作视频中提取多个样本历史图像轨迹特征以及样本目标图像轨迹特征,进行噪声扩散,得到样本轨迹噪声扩散特征;基于样本历史图像轨迹特征和样本轨迹噪声扩散特征,以样本目标图像关联的噪声扩散特征为训练目标,对预设模型进行训练;将机器臂的当前图像轨迹特征输入至训练好的目标视频扩散模型,以获取扩散得到的多个预测噪声扩散特征,并通过目标视频扩散模型包含的多层级联的动作适配器基于多个预测噪声扩散特征进行特征融合,得到多个预测动作特征,以基于多个预测动作特征对应的动作控制信号进行机器臂控制,从而提高机械臂动作预测以及控制的准确性。
技术关键词
轨迹特征
样本
图像
动作特征
噪声
适配器
机器臂控制装置
计算机可执行指令
解码器
动作控制模块
视频特征提取
视觉特征
级联
更新模型参数
模型训练模块
视频帧
系统为您推荐了相关专利信息
多旋翼无人机
图像识别方法
交叉注意力神经网络
序列
图像金字塔
人形机器人上肢
姿态估计方法
关节点
坐标系
量测噪声