摘要
本发明公开了一种面向复杂博弈对抗任务的智能体训练方法和系统,属于博弈对抗中智能体训练技术领域。方法包括:首先,在博弈对抗仿真平台设计并训练强化学习智能体;其次,利用这些智能体进行相互博弈对抗,采集数据,并使用滑动窗口法预处理轨迹数据,对手意图数据进行标注和清洗;随后,利用Transformer和LSTM分别训练轨迹预测模型和意图预测模型;最后,将两个模型里面的多模态对手信息进行特征提取和融合,构成新的具备对手建模功能的决策网络进行再训练,得到更加高级的智能体。本发明在空中博弈对抗等复杂场景中,通过对多模态对手建模的深入研究,增强了基于对手建模构建全面有效策略的能力,提升了智能体在复杂任务中的表现及其针对对手动态实时调整策略的能力。
技术关键词
智能体训练方法
轨迹预测模型
意图
预测模型训练
全方位数据采集
仿真平台设计
分析单元
决策
滑动窗口技术
滑动窗口方法
长短期记忆网络
滑动窗口法
机动机
阶段
序列
网络架构
系统为您推荐了相关专利信息
故障实体
智能问答方法
意图识别模型
大型设备
语句
指令
意图
数据生成输出
大语言模型
计算机程序产品