摘要
本发明公开了一种基于深度策略性梯度的无人艇对抗反制方法,(1)为加快模型训练速度,提出了一种单神经元比例自适应控制方法对策略网络进行预训练;(2)为实现安全稳定地追踪目标船,采用了基于演员‑评论家方案的安全李雅普诺夫深度策略性梯度算法。与现有技术相比,本发明提升了系统的跟踪拦截效率,降低拦截耗时,有效提高了系统跟踪拦截的鲁棒性、安全性和稳定性,为无人艇拦截控制系统的可靠安全运行提供了解决方案。
技术关键词
反制方法
策略性
无人艇
拦截控制系统
梯度算法
训练神经网络模型
比例积分控制器
李雅普诺夫函数
追踪方法
数据
参数
鲁棒性
在线
速度
力矩
运动
规划
变量
系统为您推荐了相关专利信息
磁共振指纹
字典
模式匹配
非均匀傅里叶变换
条目
神经网络控制器
切换控制方法
李雅普诺夫函数
水面无人艇系统
切换控制系统
电力系统运行数据
分层强化学习
模仿学习方法
网络
参数
无人机反制方法
摄像装置
图像
三角测量法
特征匹配算法