基于自适应课程强化学习的无人艇围捕对抗决策方法

AITNT
正文
推荐专利
基于自适应课程强化学习的无人艇围捕对抗决策方法
申请号:CN202510796440
申请日期:2025-06-16
公开号:CN120779936A
公开日期:2025-10-14
类型:发明专利
摘要
本发明公开基于多智能体课程强化学习的无人艇围捕对抗决策方法,所述方法包括:构建包含动态目标和多岛礁的海洋对抗仿真环境;设计归一化状态空间表征敌我运动态势、多尺度奖励函数及连续动作空间;在集中训练分散执行框架中部署自适应课程调度器,动态调整训练环境复杂度、动作噪声强度和策略熵系数;采用多智能体近端策略优化(MAPPO)算法训练决策模型。该调度器基于滑动窗口成功率、训练回合数和性能停滞计数器动态升降级环境难度,解决稀疏奖励和策略泛化问题。实验表明,本方法显著提升围捕成功率、缩短任务时间并降低碰撞率。
技术关键词
无人艇 决策方法 动作噪声 连续动作空间 调度器 表达式 滑动窗口 动作策略 运动控制算法 协同控制策略 定义 网络 动态 岛礁 仿真场景 速度 策略更新 计数器 仿真环境
系统为您推荐了相关专利信息
1
面向移动群智感知的多目标自适应无人机路径规划方法及系统
移动群智感知 无人机 DQN算法 路径规划系统 策略
2
一种基于推理实例快照的推理平台
推理平台 快照 容器 内存 节点
3
一种基于联邦学习对LLM进行自适应微调的方法
客户端 服务器 优化网络参数 语义 层级
4
基于大语言模型的城乡供水系统的调度决策方法及系统
调度决策方法 预测需水量 大语言模型 数据 聚类
5
一种异构海洋机器人的动态交会控制方法
海洋机器人 无人潜器 辅助控制器 动能 耗散结构
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号