摘要
本发明公开了一种基于多Agent强化学习的边缘计算任务调度方法,属于边缘计算技术领域。方法在首先每个移动设备上创建一个包含两个agent的强化学习agent,通过网络环境信息计算上述两agent的状态信息,在每个时间片开始时刻,移动设备根据所计算状态信息对该时刻任务对调度代价值进行计算,进而选择代价最小的调度动作完成调度决策。本发明方法通过强化学习方法自动分析终端设备与环境交互所产生的复杂的状态特征,在每个时间片的开始根据状态信息优选调度动作,根据调度动作进行相关任务的卸载处理,有效的解决了移动边缘计算中存在的大规模离散动作空间问题。实验数据表明,本发明方法在时延、任务丢弃率、带宽利用率等方面较现有方法均具有更优的性能。
技术关键词
任务调度方法
移动设备
决策
边缘计算技术
强化学习方法
节点
终端设备
硬件设备
时间片
计算方法
矩阵
网络
时延
数学
链路
因子
元素
数据
系统为您推荐了相关专利信息
信息展示方法
因子
无监督聚类
画像特征
生成用户
任务调度方法
AI算法
执行算法
关系型数据库
任务调度装置
关键帧提取方法
视频矩阵
视频信号处理
视频监控数据
图像
预检分诊系统
数据分析模块
触控显示屏
终端设备
患者
健康咨询平台
隐私保护方法
数据访问
审计日志
终端设备