摘要
本申请实施例提供了一种游戏机器人的训练方法、装置、设备及存储介质,属于人工智能技术领域。该方法包括:获取游戏机器人所在消除游戏的当前棋盘的状态;对当前棋盘的状态进行特征提取处理,得到当前棋盘中消除对象的类图像特征和关卡的向量特征;对类图像特征和向量特征进行特征融合处理,得到当前棋盘的融合特征;基于当前棋盘的融合特征进行游戏机器人的自我对弈,产生训练数据;基于训练数据,对游戏机器人进行基于PPO的强化学习训练,得到训练好的游戏机器人。本申请实施例能够降低训练成本,提供具有更高决策能力、更快决策速度的游戏机器人。
技术关键词
游戏机器人
棋盘
融合特征
网络
数据
策略
图像
计算机设备
对象
可读存储介质
特征提取模块
人工智能技术
训练装置
标签
处理器
决策
存储器
系统为您推荐了相关专利信息
穿戴设备控制系统
拉力传感器
电刺激模块
信号采集模块
数据传输模块
MR设备
虚实融合方法
点云地图
坐标系
融合历史