摘要
本发明涉及海洋智能系统技术领域,具体涉及一种基于DDPG‑DKNN的无人潜器路径跟踪方法,包括:实时采集无人潜器的航行指标,并以此构建DDPG算法的状态空间。基于双层网络架构,在Actor网络中生成动作策略,采用Critic网络评估其值函数,为策略的优化提供反馈。引入DKNN算法,在重播缓冲区中选择与当前状态最相似的样本,优化经验回放过程,增强算法的泛化能力。基于均方误差计算Critic网络的损失函数,采用随机梯度下降法迭代更新参数,不断提高网络的评估精度。基于DDPG‑DKNN算法实时生成控制策略。与现有技术相比,本发明具有提高无人潜器的路径跟踪精度等优点。
技术关键词
路径跟踪方法
无人潜器
动作策略
随机梯度下降
确定性策略梯度
算法
连续动作空间
网络架构
样本
更新网络参数
回放技术
深度神经网络
生成动作
智能系统
控制策略
动态
因子
系统为您推荐了相关专利信息
数据动态更新方法
斯塔克尔伯格博弈
数据更新
年龄
客户端终端
心脏超声检查
卷积神经网络模型
辅助系统
模型训练模块
图像处理模块
品质识别方法
神经网络模型
图像采集模块
通道
大型花卉
语义分割训练方法
盲人眼镜
噪声标签
空间分布规律
最小化噪声
甲状腺结节良恶性
分类模型训练
半监督学习模型
无标签数据
良恶性判别