摘要
一种基于GA‑DQN协同的DNN推理动态分区与任务调度方法,在多用户多服务器的场景下为每个设备部署经过训练的多出口DNN模型以进行任务推理,在一段时隙内,任务到达用户设备满足泊松分布并被存储在用户设备的任务队列中;以策略可行性区间为约束,以任务的分区点、提前退出选择、服务器选择以及调度决策为优化变量,建立以最大化一段时隙内任务推理的总完成率和推理准确率为目标的优化问题P;建立马尔可夫决策过程,使用GA‑DQN协同优化策略求解问题P。本发明适用于多用户多服务器进行动态的DNN推理分区与调度,能有效提高一段时间内的任务完成率和推理准确率。
技术关键词
服务器
任务调度方法
决策
分区
DNN模型
遗传算法
深度Q网络
染色体
多用户
策略
奖惩机制
动态
队列
变量
数学模型
时延
分类器
参数
系统为您推荐了相关专利信息
管理系统
混合预测模型
大数据
门机系统
电梯机械
物联
数据类型信息
数据处理模块
命令
远程运维方法