摘要
本发明提供一种基于在线进化的多智能体架构,涉及多智能体系统技术领域,该基于在线进化的多智能体架构将控制智能体决策后在真实世界中执行动作获得的实际奖励与虚拟世界预测的虚拟奖励比较,根据比较结果决定是否需要更新感知智能体,利用虚拟世界中的生成式模型的专家知识来辅助控制智能体的决策,通过将这些生成信息与虚拟世界中的现有信息融合以缩小决策范围,实现了感知、控制与生成的协同,架构将控制智能体在物理环境中执行动作后获得的反馈信息作为新增数据加入到感知智能体的相应数据集中,并通过它们的协同优化来调整感知智能体的模型,使智能体在适应不断变化的环境条件的同时也保证可扩展性、可解释性和收敛效率。
技术关键词
控制智能体
智能体模型
在线
决策算法
强化学习算法
多智能体强化学习
启发式搜索算法
数据
多智能体系统
标签
特征提取模型
贪婪策略
学习方法
场景
表达式
参数
融合特征
系统为您推荐了相关专利信息
历史管理
预测分析系统
云平台
预测分析方法
管理意图
中间层
决策
柔性作业车间调度
工件
深度强化学习算法
直流矿热炉
遗传算法
工况参数
测量方法
网络结构