摘要
本发明提供了一种通信受限场景中多AUV系统的任务分配方法,属于AUV技术领域,包括以下步骤,S1、建立马尔可夫决策模型;S2、利用线性回归算法设计策略估计模块;S3、根据步骤S2的策略估计模块设计指导协作的奖励函数;S4、包括以下步骤,改进分布式多AUV系统的DQN算法。本发明利用策略估计模块对每个AUV实时的策略进行估计,从而实现了无通信状态下AUV间的信息互换,以此完成了多AUV系统高效协作地访问任务目标,极大程度上提高了整体的效率及性能。
技术关键词
任务分配方法
策略
线性回归算法
受限
函数学习方法
场景
传感器
决策
定义
方程
历史位置信息
周期性地重复
深度Q学习
线性回归模型
随机梯度下降
样本
采取行动
模块
系统为您推荐了相关专利信息
智能预警系统
指标
数据采集频率
医疗信息处理技术
决策树算法
稳定控制系统
电网仿真
模拟装置
信号转换模块
模拟量输出板卡
高速旋转机构
信号监测方法
采集单元
轴承内外圈故障
SVM算法