摘要
本发明公开了一种基于深度强化学习的服务功能部署及无人机边缘节点资源分配方法,包括:根据地面任务和无人机的部署场景,构建二维任务调度模型;定义智能体的状态空间;设置智能体的动作空间为每个时隙需要卸载的子任务选择的无人机序号以及每架无人机在各时隙的动作;基于降低DAG任务的卸载时延和无人机边缘节点部署成本的加权和,定义系统开销,并设计智能体动作的奖励函数;选择深度强化学习模型并进行模型结构配置;采用多智能体强化学习方法进行调度模型训练并部署到地面控制站,供地面控制站调度决策使用;本发明基于深度强化学习方法能够均衡多无人机边缘计算下无人机部署成本与任务卸载时延,降低部署成本,适应不同的部署场景。
技术关键词
节点资源分配方法
地面控制站
深度强化学习模型
任务调度模型
移动设备
多智能体强化学习
时延
概率密度函数
深度强化学习方法
深度双Q网络
定义系统
策略
深度Q网络
场景
多无人机
系统为您推荐了相关专利信息
智能任务调度方法
主机特征
网络
电子设备
调度器
电化学储能设备
画像建模方法
可调设备
充放电功率
居民
智能取样方法
铜板表面
深度强化学习模型
通道注意力机制
钻头
培训系统
数据同步
低空飞行器
培训设备
数据传输协议
深度强化学习模型
网络拥塞控制方法
传输路径
字典
数据