基于扩散模型的在线强化学习数据增扩方法

正文

推荐专利

基于扩散模型的在线强化学习数据增扩方法

申请号：CN202510034638

申请日期：2025-01-09

公开号：CN119476372B

公开日期：2025-04-29

类型：发明专利

摘要

本发明公开了一种基于扩散模型的在线强化学习数据增扩方法，包括对原始轨迹数据进行处理生成增强特征数据；提取全局结构表示和局部细节表示；采用层级整合方法进行融合，得到统一的分层表示数据；基于预先存储的物理约束参数和任务约束参数，生成约束编码数据，融合生成约束感知表示数据；基于当前策略参数生成评估结果；对约束感知表示数据进行自适应调整，得到调整后的表示数据；进行模态分析，生成多样化的轨迹数据，得到候选轨迹集合；进行质量评估，并通过多目标优化方法进行轨迹筛选，更新策略网络参数，得到更新后的策略参数。本发明能够自动生成高质量的训练数据，提升强化学习系统的训练效率和性能。

技术关键词

轨迹时序特征在线参数相关性计算方法多尺度特征动态时间规整算法交互特征模态分析数据存储器强化学习系统动态更新方法策略优化方法特征分析方法关联分析方法小波变换处理注意力机制拉格朗日方程

系统为您推荐了相关专利信息

一种提高火电机组灵活运行的优化方法

关键控制参数机组运行状态优化预测模型机器学习算法火电

基于常春藤算法的水库分期分级旱限水位确定方法及系统

常春藤算法水库蓄水量数据收集模块生态需水

一种多种检测方法融合的疲劳驾驶检测方法

面部图像识别疲劳驾驶状态疲劳驾驶检测方法疲劳驾驶预警车辆行驶参数

一种面向精密机床主轴的在线分析方法及系统

精密机床主轴在线分析方法周期性特征机械部件测试技术数据

管道缺陷识别方法、装置、存储介质及设备

管道缺陷识别方法谱图特征声学传感器深度学习模型时序特征

基于扩散模型的在线强化学习数据增扩方法

站点导航

APP 下载