一种基于安全强化学习的无人艇姿态控制方法

正文

推荐专利

申请号：CN202510682316

申请日期：2025-05-26

公开号：CN120686810A

公开日期：2025-09-23

类型：发明专利

摘要

本发明涉及无人艇领域，具体涉及一种基于安全强化学习的无人艇姿态控制方法，包括如下步骤：获取无人艇的动作状态；将动作状态作为马尔科夫决策模型的状态空间，生成动作输入空间；根据无人艇姿态的安全性约束，设计安全强化学习算法，在考虑安全性约束成本条件下，动态生成控制无人艇动作的动作序列，并输出其中的最优动作序列；评估无人艇在执行所述最优动作序列后，无人艇的姿态是否在安全阈值内；将动作序列作为无人艇交互数据储存至经验回放缓冲区中作为经验，以供安全强化学习算法不断学习。在安全强化学习算法的优化目标中引入了安全性约束，用于平衡最大化奖励和安全约束成本，避免了无人艇只关注最大化奖励而忽略安全性的问题。

技术关键词

无人艇姿态控制方法强化学习算法梯度下降法坐标系序列生成动作网络闭环控制纵摇角度决策定义核心参数减摇鳍陀螺误差动态力矩速度

系统为您推荐了相关专利信息

一种基于多模态传感融合的锅炉管壁减薄检测方法

锅炉管壁红外热像图坐标系配准可见光相机卷积神经网络分类

一种机床旋转轴的几何误差测量方法

误差测量方法工作台坐标系矩阵方程

一种基于背景平面点云的反光物料机器人抓取位姿检测方法

位姿检测方法物料机器人点云机器人抓取反光

一种屋顶光伏可视化设计方法、系统及介质

屋顶可视化设计方法三维场景模型光伏组件数据

基于位置检测的鱼缸动态交互显示装置及交互实现方法

深度神经网络处理器图形处理芯片鱼缸动态背景微型摄像头

一种基于安全强化学习的无人艇姿态控制方法

站点导航

APP 下载