摘要
本发明涉及通信技术领域,特别涉及一种无人机时空众包的资源分配方法及装置。方法包括:将无人机和IoT设备的三维服务区映射到二维,获得二维服务区的坐标范围和时间数据集合;基于无人机的时间数据集合收集每个时间段内的IoT数据;预设无人机禁飞区,计算无人机的边界约束和禁飞区约束;预设多个优化目标进行加权平衡;将优化问题表述为马尔科夫决策过程;采用双延迟深度确定性策略梯度法,对无人机的飞行动作和IoT的功率进行分配。本发明部署了一种先进的强化学习算法,即TD3。它利用深度神经网络基于演员‑评论家架构来逼近策略和价值函数,因此它在高性能和低时间复杂性方面表现出色,且验证了所提出的算法的有效性。
技术关键词
无人机
资源分配方法
时间段
资源分配设备
资源分配装置
决策
策略
计算机可读指令
物联网设备
坐标
资源分配模块
强化学习算法
深度神经网络
损耗
数据获取模块
功率
系统为您推荐了相关专利信息
家用智能消防
无人机系统
高强度合金钻头
气味传感器阵列
机箱
空地协同
融合点云数据
林区
支持向量机分类算法
森林结构参数
通信信号接收方法
通信信号接收装置
可变增益放大器
可变衰减器
数字信号处理芯片