摘要
本发明公开了一种基于样本迁移的智能兵棋推演决策方法,属于人工智能和军事推演游戏技术领域;该方法包括:确定兵棋推演迁移的环境信息,并构建参考数据集;基于CycleGAN网络框架构建迁移网络模型,利用参考数据集对迁移网络模型进行训练,并利用训练好的迁移网络模型生成迁移数据;根据迁移数据构建软约束条件;并在软约束条件的约束下,利用迁移数据和当前作战场景状态下的探索数据对智能体模型进行训练,得到训练好的智能体模型;训练好的智能体模型用于智能兵棋推演决策。该方法具有更高的样本迁移相似度和知识传递性,同时,克服了现有方法在非理想数据下训练效果不佳的问题,提升了算法的鲁棒性。
技术关键词
智能体模型
决策方法
强化学习策略
样本
网络
还原数据
通信接口
可读存储介质
场景
游戏技术
存储器
框架
处理器
度量
鲁棒性
计算机
电子设备