摘要
一种基于深度强化学习的水下航行器自动避障策略训练方法,首先构建水下航行器的物理与动力学模型、世界与随体坐标系,然后构建基于Gym的算法环境,并定义其状态空间、动作空间、奖励函数和结束条件,接着利用四元数变换更新位置与状态空间的参数,然后基于算法环境,利用深度强化学习算法进行训练,获得避障神经网络模型,最后基于该模型,实施避障策略;在应用中,通过构建水下航行器的物理与动力学模型,以准确反映复杂环境,并结合两种坐标系,直观描述航行器的位置和姿态,然后利用深度强化学习,学习复杂避障策略,使其能够扩展到三维空间自动路径规划等任务场景中,以便在未知环境中自主制定导航与避障策略。因此,本发明的适用范围较广。
技术关键词
水下航行器
障碍物
坐标系
深度强化学习算法
人工智能算法
神经网络模型
表达式
策略
传感器
方向舵
自动路径规划
参数
物理
矩阵
误差
直线
方程
尾舵
系统为您推荐了相关专利信息
智慧工地
疲劳寿命预测
三维动态模型
时空卷积神经网络
多模态传感器
资产管理方法
顶点
实物资产
纹理
时间序列预测模型
路径规划方法
机器人
静态障碍物
动态障碍物
轨迹预测模型
射电望远镜
误差补偿方法
位姿误差
机构运动学
平台