面向空间机械臂的抓取与放置任务的基于同伦的元强化训练方法

正文

推荐专利

申请号：CN202411535420

申请日期：2024-10-31

公开号：CN119567245B

公开日期：2025-09-19

类型：发明专利

摘要

本发明涉及空间机械臂控制技术领域，具体涉及一种面向空间机械臂的抓取与放置任务的基于同伦的元强化训练方法，包括：获取元任务行为空间、元任务状态空间以及元任务奖励函数；构建元强化训练的同伦任务序列；获取每个同伦任务下更新后的SAC神经网络参数，获取更新后的目标元神经网络参数及更新后的Meta‑SAC算法的目标神经网络模型；将机械臂的当前状态更新为下一状态。本发明相比于传统的强化学习以及迁移学习方法，实现了更高的成功率以及更快的收敛速度，在空间机械臂的控制领域具有更好的表现。

技术关键词

强化训练方法 SAC算法神经网络参数机械臂末端执行器空间机械臂控制技术神经网络模型序列策略表达式迁移学习方法状态更新元学习算法坐标

系统为您推荐了相关专利信息

一种时变大载荷下压电作动器动态复合迟滞的建模及补偿方法

迟滞模型 LSTM神经网络特性测试系统实时控制器动态

一种基于BP神经网络算法预测电池SOC的方法

BP神经网络算法上位机软件电池管理系统 BP神经网络模型神经网络参数

一种基于LSTM神经网络的星座目标识别方法

LSTM神经网络轨道识别方法神经网络训练数据

一种基于因果变分推断的去混杂因素多行为推荐方法

自动编码器变量项目表达式多头注意力机制

基于贝叶斯更新和自适应元学习采样方法的结构系统识别方法

采样方法结构系统采样器更新方法样本

面向空间机械臂的抓取与放置任务的基于同伦的元强化训练方法

站点导航

APP 下载