摘要
本发明公开了无标签分布式深度强化学习的多智能体动态任务分配与协同寻路系统,包括以下步骤:步骤一、接收基于分布式深度强化学习的多智能体系统中各智能体的状态信息和环境感知数据;步骤二、提取所述环境感知数据和智能体状态信息的特征表示,并通过注意力机制进行多源异构信息融合,获得状态‑任务匹配特征;步骤三、将状态‑任务匹配特征实时传递给多智能体网络,采用基于任务优先级的分层调度与状态交换机制实现智能体间的任务分配协商,动态检测新增任务类型并进行增量学习,实现模型的在线更新迭代辅助多智能体优化任务分配策略及路径规划动作;本发明与现有的技术相比的优点在于:通过运用分布式深度强化学习技术和智能体间的状态交换机制,使系统能快速适应环境变化和任务动态,提高资源利用率和任务完成效率。
技术关键词
分布式深度强化学习
寻路系统
环境感知数据
多源异构信息融合
动态
任务分配策略
标签
智能体系统
复杂度
网络
注意力机制
协作决策
参数
规划
能源
信息更新
系统为您推荐了相关专利信息
智能分析方法
病理切片图像
全局特征融合
数据处理模块
高光谱图像数据
优化控制方法
深度强化学习模型
动态数据集
机电暂态
虚拟同步机
人体生物节律
信号采集模块
动态调节器
周期
生物特征数据
大语言模型
平行语料数据
低资源语言
构建系统
动态
客户
分档方法
情感分析模型
情感词典
Word2Vec模型