基于图像时频域增强和动态掩码生成网络的强化学习方法

正文

推荐专利

申请号：CN202511037479

申请日期：2025-07-28

公开号：CN120525747B

公开日期：2025-10-14

类型：发明专利

摘要

本申请公开基于图像时频域增强和动态掩码生成网络的强化学习方法，包括：获取智能体在不同交互环境中的观测状态图像，并送入图像时域‑频域增强模块中，进行图像时频域增强；构造基于空间注意力的图像动态掩码生成网络，对增强后的图像进行动态掩码加权处理，去除图像中与智能体预设任务无关的干扰信息；在AC框架强化学习网络中，将经过动态掩码加权处理后的图像送入强化学习网络中，预测智能体的执行动作；以在交互环境中获取最高分数为目标，对智能体的执行动作进行实时调整，直到完成预设任务。本发明所提出方法能精确捕捉到与任务最相关图像像素，提升样本利用效率，增强模型的泛化能力，提升强化学习算法的训练效果。

技术关键词

强化学习方法强化学习网络强化学习框架动态注意力状态图像数据强化学习算法网络结构机械手指生成动作融合策略图像像素三通道模块序列尺寸元素

系统为您推荐了相关专利信息

基于计算机视觉技术的智能化喷涂控制系统及方法

气刀计算机视觉技术喷涂控制方法智能化喷涂控制系统基材

一种基于多激励噪声源和分布式架构的钢混结构变形预测方法及系统

钢混结构分布式架构变形预测系统变形预测方法噪声源

一种通过人类语音匹配数字鱼偶形象水面游动动作的算法

情绪特征大语言模型强度水面深度学习算法

输送物料异物的识别方法、装置、电子设备和存储介质

卷积神经网络模型注意力机制识别方法数据分类参数

一种服务推荐质量评价方法及系统

变量评价方法服务特征效应理论

基于图像时频域增强和动态掩码生成网络的强化学习方法

站点导航

APP 下载