摘要
一种基于深度强化学习的增量收益算法涉及无线通信和数据采集技术领域。本发明针对多无人机(Unmanned Aerial Vehicle,UAV)辅助传感器网络的数据采集优化问题,首先,引入实时访问队列机制,记录每个节点的历史访问和预期访问。然后,基于实时访问队列,识别每次无人机的访问类型。最后,对于不同类型的访问计算本次访问所带来的增量收益,使用增量收益对无人机进行奖励,从而避免无人机之间的竞争行为,提升无人机的访问效率。本发明适用于智慧城市、环境监测、农业监控等多种应用场景。
技术关键词
传感器节点
无人机集群
神经网络参数矩阵
能耗
数据
深度强化学习
移动基站
策略
卫星通信天线
路径损耗模型
路径损耗指数
旋翼
无线传感器网络
算法
系统为您推荐了相关专利信息
生命周期预测模型
软件工程项目
生命周期预测方法
时序特征
强化特征
语义向量
图像搜索方法
数据
图像搜索装置
多模态
水质
分量特征
中间层
神经网络单元
网络模型训练