摘要
本发明实施例提供策略模型生成方法、游戏副本执行方法以及装置,其中所述策略模型生成方法包括:获取目标副本对应的样本数据集,其中,样本数据集包括样本状态集、样本行为集和样本激励集;基于样本状态集、样本行为集和样本激励集构建初始行为模型;基于样本状态集中的各样本状态数据,通过初始行为模型预测对应的第一样本行为,在目标副本中执行第一样本行为,获得对应的第一更新样本状态数据和第一样本激励数据,并利用第一更新样本状态数据和第一样本激励数据更新初始行为模型;在满足更新停止条件的情况下,获得副本策略模型。通过动态训练生成通用性强的策略模型,能够适应不同玩家的需求,提升游戏体验和自动化水平。
技术关键词
样本
副本
模型生成方法
策略
数据更新
游戏
指令
标识
模型生成装置
处理器
存储计算机程序
参数
计算机程序产品
执行装置
输入模块
可读存储介质
存储器
玩家
系统为您推荐了相关专利信息
故障分析模型
故障分析数据
策略
电力设备故障分析
预测故障分析
生成对抗网络
生成系统
遗传算法优化
序列
均匀分布方法
诊断建模方法
参数优化模型
卷积神经网络模型
构建卷积神经网络
企业
识别算法
模糊逻辑算法
特征参量
差分反射率因子
半监督学习算法