可直接基于预训练模型的视觉运动预测加速方法及系统

正文

推荐专利

申请号：CN202510510837

申请日期：2025-04-23

公开号：CN120029162B

公开日期：2025-07-25

类型：发明专利

摘要

本发明涉及人工智能领域，公开了可直接基于预训练模型的视觉运动预测加速方法及系统，包括：基于UNet，对输入的信号进行去噪处理，所述UNet包括编码器、中间块、解码器；计算编码器在相邻去噪步骤间的输出特征的特征差异；根据所述特征差异，判断当前去噪步骤是否为非关键步、关键步；将最近关键步的编码器特征和中间块特征，作为后续非关键步的解码器块的输入，得到噪声预测特征。提出了一种无需重新训练的新方法——快速策略，它可以被视为学习视觉运动机器人控制的扩散策略的强大且加速的替代方案，与现有加速方法的比较结果表明，快速策略在视觉运动推理速度上具有最高成功率，证明了其有效性和优越性。

技术关键词

预训练模型输出特征噪声预测编码器特征解码器视觉运动机器人傅立叶电子设备可读存储介质加速系统因子模块频域特征代表误差存储器策略

可直接基于预训练模型的视觉运动预测加速方法及系统

站点导航

APP 下载