基于无模型增量式强化学习的带臂无人机悬停稳定控制方法

正文

推荐专利

申请号：CN202411519231

申请日期：2024-10-29

公开号：CN119045317B

公开日期：2025-03-25

类型：发明专利

摘要

本发明提供了基于无模型增量式强化学习的带臂无人机悬停稳定控制方法，包括：建立无人机和带载机械臂模型，建立深度强化学习算法框架，初始化神经网络策略，设计分层奖励函数，采集无人机和带载机械臂状态信息，策略神经网络根据采集的状态信息输出增稳控制指令，与PID控制器输出的控制指令进行带参数的权值叠加，得到融合控制律，再将融合控制律输入无人机和带载机械臂模型，解算下一状态信息，利用下一状态信息计算该状态的奖励值，并结合相应动作反馈给深度强化学习算法框架，运行分布式近端优化策略输出策略梯度，计算策略的梯度下降，利用梯度下降更新神经网络，完成策略的更新。本发明能够实时给予指导信息，提升训练效率。

技术关键词

雅克比矩阵稳定控制方法坐标系深度强化学习算法坐标转换矩阵策略方程正向运动学带臂无人机机械臂关节旋翼空气阻力系数螺旋桨力矩升力采集无人机

系统为您推荐了相关专利信息

一种飞机舱门的智能动作耐久性测试系统

自动化机械设备舱门耐久性测试系统子系统视觉定位导航

一种织物悬垂形态三维量化方法

织物悬垂形态织物试样三维模型基准面逆向工程技术

一种地下水流场模拟方法及相关装置

地下水流场地形高程数据水文地质参数数字高程模型三维地质模型

用于轮毂表面缺陷检测的多工位机器人拍照任务分配方法

工位机器人三角面片模型任务分配方法表面缺陷检测模拟退火算法

一种基于数据分割算法的智能化拆分方法

拆分方法分割算法 DBSCAN聚类算法对钢结构 BIM模型数据

基于无模型增量式强化学习的带臂无人机悬停稳定控制方法

站点导航

APP 下载