摘要
本发明公开了一种面向统一体制天空地网络的任务调度方法,包括以下步骤:构建统一体制天空地网络中以任务为导向的通信场景;确定任务调度的目标问题,并将目标问题建模为马尔可夫决策过程;构建以多智能体近端策略优化为基础的策略‑价值神经网络架构;对构建的策略‑价值神经网络架构进行训练,得到训练好的策略‑价值神经网络,并基于训练好的策略‑价值神经网络与真实环境交互,动态更新信息年龄,并根据实时反馈应用策略。本发明能够针对网络架构特性和时变约束,结合强化学习框架,有效提升调度效率并优化任务分配。
技术关键词
接入点
神经网络架构
任务调度方法
策略
年龄
无人机
动态更新
能量消耗
Softmax函数
基站
定义
强化学习框架
决策
信道
索引
时延
资源
元素
系统为您推荐了相关专利信息
网络业务
虚拟网络接口
客户端设备配置
非暂态计算机可读介质
目录
复合铝板
激光焊工艺
温度分布曲线
接缝
冰箱内胆
节能控制方法
蒸饭车
电热管
双麦克风阵列
卷积神经网络分类器
配电设备
配电房
智能监测方法
区域环境数据
数据处理模组