摘要
本申请实施例提供了一种游戏机器人的训练方法、装置、设备及存储介质,属于人工智能技术领域。该方法包括:获取游戏机器人所在消除游戏的当前棋盘的状态;对当前棋盘的状态进行特征提取处理,得到当前棋盘中消除对象的类图像特征和关卡的向量特征;对类图像特征和向量特征进行特征融合处理,得到当前棋盘的融合特征;基于当前棋盘的融合特征进行游戏机器人的自我对弈,产生训练数据;基于训练数据,对游戏机器人进行基于PPO的强化学习训练,得到训练好的游戏机器人。本申请实施例能够降低训练成本,提供具有更高决策能力、更快决策速度的游戏机器人。
技术关键词
游戏机器人
棋盘
融合特征
网络
数据
策略
图像
计算机设备
对象
可读存储介质
特征提取模块
人工智能技术
训练装置
标签
处理器
决策
存储器
系统为您推荐了相关专利信息
动作检测方法
空中无人机
检测无人机
协方差矩阵
记忆
吸入器
智能监测装置
电子模块
音频传感器系统
数据融合算法
宠物管理系统
健康管理信息
宠物健康
机器学习模型
人机交互方式
桩基结构
码头桩基
关联特征数据
工况特征
材料力学性能分析