一种基于分层强化学习的技能连招构建方法及终端

正文

推荐专利

申请号：CN202510409422

申请日期：2025-04-02

公开号：CN120478979A

公开日期：2025-08-15

类型：发明专利

摘要

一种基于分层强化学习的技能连招构建方法及终端，利用深度时序建模算法对虚拟环境的状态数据进行建模并依据状态数据生成子目标序列；基于子目标序列生成第一连招序列，识别第一连招序列中的违规操作和潜在风险并优化生成第二连招序列；以连招效果、资源消耗和连招稳定性为目标，利用奖励函数对第二连招序列进行优化，构建生成最优技能连招序列。本发明利用深度时序建模算法对虚拟环境进行全面建模，通过规则约束和决策搜索算法对连招合法性和稳定性进行验证和优化，有效规避技能连招中的违规操作和潜在风险，提高构建连招的动态适应性，从而实现高覆盖率，有效提升了技能连招测试效率。

技术关键词

分层强化学习序列建模算法搜索算法强化学习算法时序风险终端决策数据策略机制资源模式处理器覆盖率存储器动态

系统为您推荐了相关专利信息

一种基于数据分析的高空作业平台智能监管方法及系统

高空作业平台智能监管方法序列风险动态时间规整

一种基于时序建模的疲劳驾驶行为识别方法

识别方法双向长短期记忆网络时序样本分类模型构建

一种基于区域定位的目标检测方法

建立神经网络模型像素点标签 CT图像序列直方图

图像处理方法、装置和电子设备

人工智能图像识别分辨率图像处理方法参数色块

一种优化脉冲神经网络估算电池SOC的方法

脉冲搜索算法动力电池神经网络结构安时积分法

一种基于分层强化学习的技能连招构建方法及终端

站点导航

APP 下载