摘要
本发明涉及一种不完美信息下基于深度强化学习的水下多AUV攻防博弈方法,其步骤包括:首先,在海洋环境处于不完全信息条件下,开展基于多AUV协作的攻防博弈。其次,考虑水下噪声干扰,建立水下环境模型。接着,建立AUV动力学和六自由度方程。随后,AUV集群内设定水声通信和短距离光通信混合方式,基于MADDPG方法,改良经验回放机制,优化奖励函数,搭建基于Actor‑Critic结构的学习框架,解决不完美信息下的博弈问题。本发明能够有效提高海洋保护的智能化、信息化和无人化,对水声工程防护、海战场作战等水下应用的奠定理论基础。
技术关键词
深度强化学习
博弈方法
网络
空间六自由度运动
坐标系
混合策略方法
水下无线光通信
障碍物
定义
连续动作空间
奠定理论基础
参数
DQN算法
方程
链路
水声工程
节点
水下噪声