摘要
本说明书公开了一种游戏决策模型训练方法、装置、存储介质及电子设备,获取样本玩家的历史游戏视频,对历史游戏视频进行数据提取,确定指定时间段内样本玩家的游戏数据,并作为训练样本,以及确定在训练样本对应的游戏状态下样本玩家执行的决策对应的第一决策信息,并作为训练样本的第一标注。确定训练样本对应的第一提示文本,并将第一提示文本和训练样本输入通用大语言模型,确定通用大语言模型输出的第一信息。将第一标注和第一信息作为训练样本的第二标注,根据训练样本和第二标注,对待训练的游戏决策模型进行训练,以使得训练完成的游戏决策模型可用于根据待决策玩家的游戏数据,确定游戏决策,提高了游戏决策的生成速度以及准确性。
技术关键词
游戏
大语言模型
玩家
决策模型训练方法
文本
样本
数据
时间段
视频
模型训练装置
电子设备
处理器
模块
可读存储介质
存储器
指令
计算机
模板
程序