摘要
本发明公开了一种基于最大熵强化学习的多智能体协同调度方法及系统,该方法包括:根据生产线的第一环境数据,生成环境状态向量;根据所述环境状态向量,生成初始生产任务;对所述初始生产任务进行任务调度操作,并生成路径规划;对所述环境状态向量、所述初始生产任务以及所述路径规划进行存储,得到经验数据;根据所述经验数据,通过最大熵强化学习算法对初始策略模型进行训练,得到目标策略模型;根据所述目标策略模型,得到多智能体协同的目标调度策略。本发明能够提高多智能体协作效率,从而提升生产效率,可以广泛应用于智能体调度技术领域。
技术关键词
协同调度方法
策略
网络通信机制
强化学习算法
多智能体协同
任务调度
协同调度系统
数据
避让机制
规划
多层次
多智能体协作
代表
模块
动态
处理器
可读存储介质
程序
存储器
系统为您推荐了相关专利信息
广播抑制方法
抑制广播风暴
时序预测模型
时序分析技术
长短期记忆网络
温差发电单元
光伏发电组件
高温甲醇燃料电池
供电无人机
能量管理策略