摘要
本发明公开了一种基于深度强化学习的水下多AUV任务分配方法,将水下区域进行网格化处理;建立基于深度强化学习算法的优化分配策略,确定每个AUV要收集的传感器节点及沿节点的访问路径;设定目标函数为总任务完成路径时延最小,设置当前最优任务分配策略为策略φ;令从首个节点开始,以ε概率随机分配节点,以1‑ε概率按照策略φ分配节点;重复上述过程至节点分配完毕;计算AUV在两节点间行驶时延,并将其定义为边时延;将AUV访问节点顺序定义为非对称TSP问题并采用LKH算法解决;计算AUV在所有节点间航行的边时延矩阵并将其输入优化分配策略中;使用GA算法生成初始策略φ,再迭代优化策略φ,直至得到目标函数最优解。本发明降低了多AUV的收集时延。
技术关键词
传感器节点
网格
任务分配方法
任务分配策略
时延
深度强化学习算法
网络
速度
延迟矩阵
贪婪策略
顶点
坐标
参数
轨迹
水下噪声
样本
系统为您推荐了相关专利信息
运动监测系统
图像特征向量
可见光图像
激光雷达点云数据
顶点
室内环境控制方法
分布式优化算法
梯度下降算法
数据
协同控制策略
无损检测方法
山楂
高光谱成像系统
SVR模型
无损检测系统
复合材料液体成型
自定义函数
液体成型工艺
数学模型
复合材料固化成型技术
智能控制装置
机器学习模型
地下水流数值
速率
损耗