基于深度强化学习的水下航行器自动避障策略训练方法

正文

推荐专利

申请号：CN202411817894

申请日期：2024-12-11

公开号：CN119336032B

公开日期：2025-04-04

类型：发明专利

摘要

一种基于深度强化学习的水下航行器自动避障策略训练方法，首先构建水下航行器的物理与动力学模型、世界与随体坐标系，然后构建基于Gym的算法环境，并定义其状态空间、动作空间、奖励函数和结束条件，接着利用四元数变换更新位置与状态空间的参数，然后基于算法环境，利用深度强化学习算法进行训练，获得避障神经网络模型，最后基于该模型，实施避障策略；在应用中，通过构建水下航行器的物理与动力学模型，以准确反映复杂环境，并结合两种坐标系，直观描述航行器的位置和姿态，然后利用深度强化学习，学习复杂避障策略，使其能够扩展到三维空间自动路径规划等任务场景中，以便在未知环境中自主制定导航与避障策略。因此，本发明的适用范围较广。

技术关键词

水下航行器障碍物坐标系深度强化学习算法人工智能算法神经网络模型表达式策略传感器方向舵自动路径规划参数物理矩阵误差直线方程尾舵

系统为您推荐了相关专利信息

一种无人艇上的多波束声呐高效滤波与畸变剔除方法、程序、设备及存储介质

波束剔除方法换能器声呐滤波算法

一种智慧工地项目中的塔机监控系统

智慧工地疲劳寿命预测三维动态模型时空卷积神经网络多模态传感器

基于模型与视频融合的资产管理方法、装置及存储介质

资产管理方法顶点实物资产纹理时间序列预测模型

一种考虑清渣区域人员预警的TBM清渣机器人的清渣路径规划方法及清渣系统、计算机装置

路径规划方法机器人静态障碍物动态障碍物轨迹预测模型

全向可动射电望远镜副面调整机构全仰角误差补偿方法

射电望远镜误差补偿方法位姿误差机构运动学平台

基于深度强化学习的水下航行器自动避障策略训练方法

站点导航

APP 下载