摘要
本发明属于计算技术领域,提高了一种基于深度强化学习的MOBA游戏AI算法,该旨在解决虚拟自博弈导致的策略退化和在有限资源下高效训练MOBA游戏AI的技术问题。主要方案包括融合策略多样性和胜率的虚拟自博弈改进算法,稳定策略更新的双重裁剪损失函数,以及基于深度强化学习的网络模型设计,通过构建多样性评分的虚拟自博弈算法,加入策略多样性的评价因子,并采用模型融合策略,增强了策略的鲁棒性,双重裁剪损失函数的近端策略优化算法,确保了策略更新的稳定性和收敛性。深度强化学习的网络模型设计,使用全连接与循环神经网络的设计,加速了网络运行并增强了时序处理能力。该算法用于提高游戏AI的训练效率和算法的稳定性,增强AI在游戏中的表现。
技术关键词
深度强化学习
高维特征向量
AI算法
策略更新
特征提取模块
融合策略
博弈算法
采取行动
时序特征
网络
因子
游戏环境
评分机制
鲁棒性
参数
表达式
系统为您推荐了相关专利信息
光伏储能设备
时序
故障检测方法
卷积神经网络模型
参数
蝗虫
路径规划方法
局部路径规划
全局路径规划
算法
跟踪识别系统
多模态信息
车辆
动态
特征提取模块
智能管理方法
知识图谱驱动
测试用例生成器
计算机可读指令
生成对抗网络