摘要
本发明公开了一种基于强化学习与模仿学习的灵巧手航空部件重定向方法,包括如下步骤:S1、设定任务背景,并建立灵巧手与航空部件交互的仿真环境;S2、通过深度强化学习策略训练出具备初步操作能力的控制策略;S3、利用步骤S2中训练得到的控制策略,批量采集灵巧手的操作过程中的多类数据,并对数据进行筛选,基于筛选后的数据构建数据集;S4、在步骤S3中构建的数据集的基础上,基于扩散模型进行模仿学习训练,以训练完成灵巧手重定向控制策略。本发明通过将Diffusion Policy结构引入灵巧手控制任务中,实现了在无特权信息条件下,仅依靠图像观测完成稳定、高效、端到端的动作生成控制,显著提升了三指灵巧手对航空部件重定向任务的自动化能力与策略迁移性。
技术关键词
重定向方法
航空
控制策略
仿真环境
强化学习策略
摄像头系统
数据
分支卷积神经网络
物理仿真平台
图像
灵巧手控制
连续动作空间
关节
角速度信息
轨迹
姿态误差
策略更新
噪声