基于时空特征与多智能体强化学习的多机智能博弈方法

正文

推荐专利

申请号：CN202510554280

申请日期：2025-04-29

公开号：CN120523023A

公开日期：2025-08-22

类型：发明专利

摘要

本发明公开了一种基于时空特征与多智能体强化学习的多机智能博弈方法，属于多无人机智能博弈对抗决策领域。本发明针对复杂博弈环境，通过先前训练的降维网络，整合无人机状态信息、无人机动作信息以及环境信息等多方面数据，有助于后续的时空特征的提取；同时利用图卷积网路和循环神经网络提取时空特征进行学习，使得神经网络可以做出当前状态下每个无人机更加合理的动作策略，帮助模型更好的得到最优的决策；设计针对复杂博弈环境的奖励函数，使得神经网络的训练方向更加合理，并使得最终训练好的模型更具有可行性，有效提高网络训练效率。

技术关键词

全局状态信息博弈方法强化学习网络智能博弈对抗多智能体强化学习偏转角速度卷积模块无人机高度无人机姿态强化学习算法支路动作策略多无人机仿真软件方向舵决策解码

系统为您推荐了相关专利信息

基于缓存机制和多子载波NOMA的空天地协同边缘计算调度方法

缓存机制协同系统能耗终端通信资源配置

基于大数据分析的建筑维护系统

建筑维护系统建筑排水系统深度Q网络滑动窗口算法时间序列预测模型

一种边缘云原生环境下的统一资源调度方法、装置及介质

统一资源调度方法多智能体强化学习模拟器资源调度策略资源调度装置

基于多智能体强化学习的风电机组模块化机舱优化方法

多智能体强化学习监测风电机组强化学习算法多智能体系统功能模块

一种基于多智能体策略多样化的实现方法及系统

策略更新滑动窗口多智能体强化学习技术存储库多智能体系统

基于时空特征与多智能体强化学习的多机智能博弈方法

站点导航

APP 下载