面向混合博弈稀疏奖励的分布式多智能体强化学习方法

正文

推荐专利

申请号：CN202511021129

申请日期：2025-07-24

公开号：CN120893514A

公开日期：2025-11-04

类型：发明专利

摘要

本发明提出一种面向混合博弈稀疏奖励的分布式多智能体强化学习方法，解决动作空间庞大、奖励稀疏及拟人性差的问题。通过多服务器部署游戏环境、AI服务器和强化学习训练器，搭建分布式训练框架，实现并行数据采集与梯度同步，提升训练效率。将复合动作拆分为移动、射门等独立子集，采用动作解耦PPO算法优化策略更新。基于生成对抗模仿学习训练判别器，生成模仿奖励并融合至总奖励，增强智能体拟人性。定义球员风格类别，定制差异化奖励函数，驱动智能体学习位置专属行为。构建包含自身、队友/敌人及全局状态的三级特征空间，利用交叉注意力机制捕获状态关联性，为工业级游戏AI的多智能体协作任务提供兼顾竞技强度与拟人性的高效解决方案。

技术关键词

分布式多智能体强化学习方法交叉注意力机制人类玩家分布式训练策略更新 AI服务器球员更新模型参数游戏环境生成动作风格智能体模型训练器网络结构球类游戏动作交互

系统为您推荐了相关专利信息

基于多模态实例融合的在线矢量化高精度地图构建方法

高精度地图视角相机模态特征激光雷达点云

一种基于交叉注意力的跨域行为识别方法

识别方法融合特征数据交叉注意力机制语义

一种基于时空双注意力神经网络的浮标气象数据修复方法

注意力神经网络数据修复方法交叉注意力机制海洋资料浮标 Sigmoid函数

一种基于深度学习的土壤微生物分类方法

分类预测模型样本分类方法图像数据编码模块特征提取模块

基于深度强化学习毫米波大规模MIMO系统资源联合优化方法

联合优化方法波束成形器系统吞吐量最大化编码器 OFDM系统

面向混合博弈稀疏奖励的分布式多智能体强化学习方法

站点导航

APP 下载