摘要
本发明公开了一种基于强化学习的角色个性化行为生成方法,涉及强化学习技术领域,包括如下步骤:S1、采集角色历史行为数据,生成行为模式序列;S2、利用行为模式序列训练扩散变换器,生成初始个性化行为序列;S3、采用正反螺旋鲸鱼搜索算法优化初始个性化行为序列,输出优化后的个性化行为序列;S4、结合角色所处环境的反馈信息,对角色个性特征参数进行二次动态调整;S5、采用大语言模型对个性化行为策略进行评估,对个性化行为策略进行筛选,并输出最终个性化行为策略。本发明结合强化学习、扩散变换器和正反螺旋鲸鱼搜索算法,实现角色个性化行为生成,具备行为多样性强、个性匹配度高和环境适应性强的优点。
技术关键词
序列
生成方法
搜索算法优化
策略
大语言模型
参数
强化学习技术
螺旋
变换器
模式
双曲正切函数
动态校正
矩阵
生成噪声
定义
因子
指标
系统为您推荐了相关专利信息
忆阻混沌系统
忆阻器模型
阿诺德置乱
图像加密方法
矩阵
无线信道预测方法
无线通信系统
非线性特征
序列
时域特征
图像生成模型
智能生成方法
文本生成图像
生成对抗网络模型
联合损失函数