基于层次博弈深度强化学习的集群追逃控制方法和系统

正文

推荐专利

申请号：CN202510450379

申请日期：2025-04-11

公开号：CN119960489B

公开日期：2025-07-04

类型：发明专利

摘要

本发明提供一种基于层次博弈深度强化学习的集群追逃控制方法和系统，通过层次博弈结构将多智能体协作任务建模为集体去中心化部分可观测马尔可夫决策过程，并提出一种层次博弈多智能体深度确定性策略梯度算法模型。该算法模型包括高层策略模块和低层策略模块，高层策略模块负责目标分配和任务协调，低层策略模块通过集中训练和分布式执行优化具体行动决策。本方案能够有效提高多智能体系统在复杂环境中的协作效率和应对能力。

技术关键词

追逃博弈深度强化学习模型策略集群模块探测传感器障碍物算法模型加速度多智能体系统对象场景决策网络控制系统频率

系统为您推荐了相关专利信息

本地优先转发的实现方法、装置、网络设备、存储介质和程序产品

链路网络设备报文堆叠系统端口

一种基于大数据的学生管理系统

学生管理系统数据存储大数据分布式存储架构成绩

一种时钟门控方法、系统、装置及存储介质

数据依赖关系时钟门控方法时序排序方法动态仿真模型

一种基于客户群的交易安全监测与管理系统

身份验证模块管理系统数据分析模块集成模块生物识别技术

基于自然语言生成SQL语句的方法、装置、设备及存储介质

自然语言语句指令语义向量非暂态计算机可读存储介质

基于层次博弈深度强化学习的集群追逃控制方法和系统

站点导航

APP 下载