摘要
本发明提供了一种面向复杂任务的智能体训练方法和系统,涉及强化学习技术领域,包括:根据无人机空战对抗场景下的复杂任务构建分层决策框架,以便将复杂任务分解为多个子任务,由多个智能体分别执行子任务;对分层决策框架下各层级智能体进行独立训练;独立训练完成后,根据任务特性从不同框架中抽取部分智能体形成联合优化组合,利用强化学习算法对组合中的智能体进行联合优化。本发明在高保真空战游戏等复杂场景中,通过对分层局部联合优化技术的深入研究,提升了智能体在复杂博弈任务中的表现及其自主博弈对抗能力。
技术关键词
智能体训练方法
无人机控制器
策略
强化学习算法
联合优化技术
专家系统构建
框架
强化学习技术
分层
存储程序指令
场景
决策算法
层级
训练系统
武器
因子
信号
系统为您推荐了相关专利信息
历史温度数据
数据分析方法
强化学习算法
控制策略
温度预测模型
联运路径优化方法
深度强化学习
指标
样本
业务请求信息
智能分拣系统
智能分拣方法
承载模块
YOLO算法
建材
利润
群智感知平台
深度强化学习算法
强化学习模型
DQN算法
城市热岛效应
栅格
城市布局
地表温度数据
温度预测模型