摘要
本发明属于船舶自动控制技术领域,公开了基于PDPG的船舶连续转向智能避撞决策系统,包括PDPG模型和仿真环境,PDPG模型包括主Actor网络、目标Actor网络、主Critic网络和目标Critic网络,主Actor网络用于生成主要的转向决策以考虑当前最优的避碰策略;目标Actor网络用于在探索阶段生成不同的应急转向动作;主Critic网络通过反向传播进行网络参数的更新,并评估当前状态和当前动作的整体收益;目标critic网络以较慢的速率更新自身的网络参数,用于评估当前转向动作的安全性。本发明使船舶在执行动作时既具备安全的保守性,又不失灵活性,适应不断变化的海洋环境。
技术关键词
决策系统
仿真环境
船舶自动控制技术
生成动作
策略
参数
深度神经网络
障碍物
代表
定义
船只
有效性
指标
阶段
速率
加速度
系统为您推荐了相关专利信息
电力设备红外图像
边缘检测方法
灰狼算法
多策略
图像边缘信息
储能优化调度方法
优化调度模型
电网运行可靠性
可再生能源
储能系统充放电
广告精准投放方法
画像
设备特征
服务器集群
物流