摘要
本发明公开了一种基于深度安全强化学习的水下滑翔机路径规划方法,该水下滑翔机路径规划方法采用水下滑翔机路径规划模型,水下滑翔机路径规划模型包括:多层感知机和基于约束马尔可夫决策过程的深度神经网络,其中,多层感知机的输入为多元数据矩阵,多层感知机提取关键特征,基于约束马尔可夫决策过程的深度神经网络包括:动作网络、奖励评价网络和损耗评价网络。本发明的水下滑翔机路径规划方法通过基于深度安全强化学习的方法,可以在确保水下滑翔机安全的前提下,实现综合成本最优的路径规划,降低了路径时间和路径距离。
技术关键词
水下滑翔机
多层感知机
深度神经网络
损耗
规划
决策
坐标系
指标
PID控制器
速度
策略
生成轨迹
参数
矩阵
广义
数据
系统为您推荐了相关专利信息
小脑模型
多机器人协同作业
机器人本体
环境感知数据
云端
群智能算法
动态更新
拉丁超立方采样
模拟自然界
因子
三维重建算法
投影图像信息
局部特征信息
物体特征信息
判别特征
信号恢复方法
光电振荡器
蓄水池
调制光信号
时分复用