摘要
本发明涉及任务调度技术领域,提供了一种基于强化学习和评估模型的云任务调度方法及系统,包括:获取云任务和资源信息,通过强化学习模型的策略网络,生成云任务调度方案;对于云任务调度方案,结合云任务调度规则,通过任务调度评估大模型,得到评分和改进建议,并基于改进建议,调整云任务和资源信息后,通过训练好的强化学习模型的策略网络,更新云任务调度方案;持续收集资源情况、云任务、生成的云任务调度方案、评分和改进建议,一段时间后,根据改进建议调整强化学习模型的状态空间、动作空间和奖励函数,并对强化学习模型和任务调度评估大模型进行增量学习。有效提升了云任务执行效率和质量,保障工作的顺利完成。
技术关键词
强化学习模型
任务调度方法
任务调度系统
资源
策略
网络
任务调度技术
参数
时序
模块
标签
能耗
系统为您推荐了相关专利信息
训练深度学习模型
拓扑结构信息
交互识别方法
数据
样本