摘要
本发明属于船舶自动控制技术领域,公开了基于PDPG的船舶连续转向智能避撞决策系统,包括PDPG模型和仿真环境,PDPG模型包括主Actor网络、目标Actor网络、主Critic网络和目标Critic网络,主Actor网络用于生成主要的转向决策以考虑当前最优的避碰策略;目标Actor网络用于在探索阶段生成不同的应急转向动作;主Critic网络通过反向传播进行网络参数的更新,并评估当前状态和当前动作的整体收益;目标critic网络以较慢的速率更新自身的网络参数,用于评估当前转向动作的安全性。本发明使船舶在执行动作时既具备安全的保守性,又不失灵活性,适应不断变化的海洋环境。
技术关键词
决策系统
仿真环境
船舶自动控制技术
生成动作
策略
参数
深度神经网络
障碍物
代表
定义
船只
有效性
指标
阶段
速率
加速度
系统为您推荐了相关专利信息
智能网关控制方法
分布式传感器
数字签名数据
动态资源分配
控制策略
电导率传感器
热管理系统
供电方法
冷却液
燃料电池
多维时序数据
异常检测方法
滑动窗口技术
孤立森林算法
工业物联网数据处理