摘要
本发明属于人工智能、多智能体系统、深度强化学习以及自主探索领域,公开一种基于深度强化学习的节能多智能体探索系统,包括场景建模、效率导向观察系统、代理间策略网络、序列决策机制模块和等待机制。本发明提出的效率导向观察系统通过构建连接图和交互图的双重结构,并为节点附加探索值、距离特征、复杂度信息等多维协作导向特征,使系统能精确把握环境特征和智能体间的交互关系,显著提升多智能体系统的协同效率。本发明设计的序列决策机制模块结合了序列决策机制和等待机制,通过让智能体参考前序智能体的决策并在适当时候选择等待,避免了盲目协作造成的能源浪费。
技术关键词
探索系统
深度强化学习
节点特征
密度聚类算法
观察系统
多智能体系统
注意力
复杂度
决策
机制
生成动作
解码器
指针
编码器
占用栅格
序列
协作关系
激光扫描仪
邻居
系统为您推荐了相关专利信息
Actor模型
学习训练方法
代码结构
编辑
补丁
板块
新闻情感分析
深度强化学习
组合系统
数据获取模块
旋转激光雷达
时空卷积神经网络
智能控制系统
风电机组
智能控制方法
超表面
智能信号处理
天线阵列
信号发射单元
信号调节方法