摘要
本发明涉及人工智能领域,公开了可直接基于预训练模型的视觉运动预测加速方法及系统,包括:基于UNet,对输入的信号进行去噪处理,所述UNet包括编码器、中间块、解码器;计算编码器在相邻去噪步骤间的输出特征的特征差异;根据所述特征差异,判断当前去噪步骤是否为非关键步、关键步;将最近关键步的编码器特征和中间块特征,作为后续非关键步的解码器块的输入,得到噪声预测特征。提出了一种无需重新训练的新方法——快速策略,它可以被视为学习视觉运动机器人控制的扩散策略的强大且加速的替代方案,与现有加速方法的比较结果表明,快速策略在视觉运动推理速度上具有最高成功率,证明了其有效性和优越性。
技术关键词
预训练模型
输出特征
噪声预测
编码器特征
解码器
视觉
运动机器人
傅立叶
电子设备
可读存储介质
加速系统
因子
模块
频域特征
代表
误差
存储器
策略