摘要
本发明公开了一种基于时空约束近端策略优化的时变任务调度方法及系统,属于信息处理技术领域。包括:通过LSTM模型预测未来N个时间步的任务资源需求,生成时间动态掩码矩阵Mtime;基于三级分层约束规则生成空间动态掩码矩阵Mspace;所述三级分层约束规则包括资源容量、干扰规避、重要应用保护;将Mtime与Mspace融合为全局掩码矩阵Mt;采用改进的PPO算法,通过Actor网络输出掩码后的动作概率分布,Critic网络评估含约束惩罚的状态价值;联合优化策略网络、价值网络与掩码生成器参数,进行任务调度策略的动态迭代。本发明能够实现资源的高效利用与负载均衡,显著提升时变任务调度的稳定性和性能。
技术关键词
任务调度方法
掩码矩阵
LSTM模型
任务调度策略
任务调度系统
层级
动态
网络
资源分配策略
分层
信息处理技术
数据采集单元
策略更新
计算机程序产品
算法
参数
逻辑