摘要
本发明提供了一种基于强化学习的算力调度策略优化系统,涉及电数字数据处理领域,包括环境感知模块、强化决策模块、算力调度模块和反馈奖励模块,所述环境感知模块用于采集感知状态信息,所述强化决策模块基于强化学习输出调度策略,所述算力调度模块用于执行调度策略分配算力资源,所述反馈奖励模块基于调度效果反馈奖励信息;本系统通过强化学习模型对处理方案不断进行筛选细化,能够使输出的调度策略越来越合理,提高算力资源的利用效率。
技术关键词
处理器
策略
网络通信单元
强化学习模型
模块
资源监控
电数字数据处理
决策
监测单元
项目
节点
系统为您推荐了相关专利信息
驱动芯片
微发光器件
扫描信号线
触控驱动电极
触控感应电极
编队控制算法
无人艇集群
网络拓扑结构构建
分布式拓扑结构
模型预测控制算法
电池检测方法
ROI图像
运动装置
流水线装置
三维点云数据
智能风控系统
人工智能模块
风险评估模型
集成学习算法
数据采集模块