基于无模型增量式强化学习的带臂无人机悬停稳定控制方法

AITNT
正文
推荐专利
基于无模型增量式强化学习的带臂无人机悬停稳定控制方法
申请号:CN202411519231
申请日期:2024-10-29
公开号:CN119045317B
公开日期:2025-03-25
类型:发明专利
摘要
本发明提供了基于无模型增量式强化学习的带臂无人机悬停稳定控制方法,包括:建立无人机和带载机械臂模型,建立深度强化学习算法框架,初始化神经网络策略,设计分层奖励函数,采集无人机和带载机械臂状态信息,策略神经网络根据采集的状态信息输出增稳控制指令,与PID控制器输出的控制指令进行带参数的权值叠加,得到融合控制律,再将融合控制律输入无人机和带载机械臂模型,解算下一状态信息,利用下一状态信息计算该状态的奖励值,并结合相应动作反馈给深度强化学习算法框架,运行分布式近端优化策略输出策略梯度,计算策略的梯度下降,利用梯度下降更新神经网络,完成策略的更新。本发明能够实时给予指导信息,提升训练效率。
技术关键词
雅克比矩阵 稳定控制方法 坐标系 深度强化学习算法 坐标转换矩阵 策略 方程 正向运动学 带臂无人机 机械臂关节 旋翼 空气阻力系数 螺旋桨 力矩 升力 采集无人机
系统为您推荐了相关专利信息
1
一种飞机舱门的智能动作耐久性测试系统
自动化机械设备 舱门 耐久性测试系统 子系统 视觉定位导航
2
一种织物悬垂形态三维量化方法
织物悬垂形态 织物试样 三维模型 基准面 逆向工程技术
3
一种地下水流场模拟方法及相关装置
地下水流场 地形高程数据 水文地质参数 数字高程模型 三维地质模型
4
用于轮毂表面缺陷检测的多工位机器人拍照任务分配方法
工位机器人 三角面片模型 任务分配方法 表面缺陷检测 模拟退火算法
5
一种基于数据分割算法的智能化拆分方法
拆分方法 分割算法 DBSCAN聚类算法 对钢结构 BIM模型数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号