摘要
本发明公开一种基于近端策略优化的自适应CPU优先级调度方法,首先在仿真环境中建立任务调度模型,将当前任务队列状态和任务特征矩阵化为环境状态输入,通过引入门控循环单元提取任务序列时序特征,利用PPO的双网络架构分别输出任务优先级策略分布和状态价值估计。训练过程中采用课程学习机制从短任务负载场景逐步过渡至复杂混合负载。运行时将训练完成的调度智能体部署至操作系统内核调度器,根据当前状态实时输出每个任务的优先级,借助优先级堆实现快速调度决策。通过多目标奖励函数,引导智能体同时优化系统吞吐量、任务平均响应时间和饥饿防止指标,避免出现极端不公平调度。实验表明,本发明在异构任务、高并发和长尾负载场景下均表现出较高的性能、稳定性和鲁棒性,有效提升了系统资源利用率和用户体验。
技术关键词
优先级调度方法
双网络架构
调度特征
调度系统
调度器
门控循环单元
神经网络结构
队列结构
动作策略
系统资源利用率
策略更新
强化学习代理
任务调度模型
时序特征
决策
操作系统内核
场景
系统为您推荐了相关专利信息
设备运行状态信息
异常事件
数字孪生模型
指挥调度方法
决策
服务管理方法
负载均衡器
副本
资源调度器
标识符