摘要
本发明公开一种即时策略游戏的策略模型,将RTS游戏描述为马尔可夫博弈形式;环境大小为,和分别表示网格的高度和宽度;状态空间为;全局观测空间为,表示实数空间,表示特征通道维度;联合动作空间为,表示控制单位的动作维度;状态转移函数为;奖励函数为;策略为;策略模型为。本发明解决现有技术中存在的问题,通过策略模型架构和训练方法的创新,能够以更低的计算资源开销进行训练,同时能够适应各种RTS游戏的设定。
技术关键词
策略
人工神经网络
上下文特征
网格
强化学习算法
长短期记忆网络
通道
多线程架构
参数
深度强化学习
编码器
游戏环境
定义特征
批量数据
解码器
数据更新
系统为您推荐了相关专利信息
结构优化设计方法
结构设计方案
引入遗传算法
样本
机制
需求预测模型
粉末出料口
监测压力传感器
策略
控制执行模块
中继节点
备用电池管理系统
分析方法
动态路径优化
水文参数
电力工程项目
知识库构建方法
智能监督
文件夹
脚本