一种基于元强化学习的高光谱开放集领域泛化方法

正文

推荐专利

申请号：CN202411466041

申请日期：2024-10-21

公开号：CN119418171B

公开日期：2025-08-08

类型：发明专利

摘要

本发明属于模式识别技术领域，公开了一种基于元强化学习的高光谱开放集领域泛化方法。首先，为实现稳健的开放集识别策略学习，本发明使用背景像素模拟虚拟未知类，并使用元学习的情景模拟机制对源域中的开放集识别场景进行模拟。在情景模拟过程中，将开放集识别任务建模为内部马尔可夫决策过程，利用强化学习的反馈学习和策略优化机制，迭代优化开集识别策略。其次，为实现源域向未见目标域稳健的跨域知识迁移，本发明将跨任务知识归纳建模为外部马尔可夫决策过程，设计了不变风险奖励机制来鼓励智能体在不同的开放集识别任务中捕获跨任务共享知识。引入了Mamba作为记忆策略网络，利用其强大的上下文压缩能力实现了跨任务共享知识归纳。

技术关键词

强化学习环境泛化方法决策识别策略状态空间模型记忆图像块网络模式识别技术参数样本空谱特征动作策略轨迹机制矩阵编码器情景像素

系统为您推荐了相关专利信息

一种六足巡检机器人自动避障控制系统及方法

避障控制系统决策系统巡检机器人激光雷达点云数据电机驱动单元

一种基于个人电子病历的不确定性知识图谱自动构建方法

节点实体关系病历知识图谱构建实验室信息管理系统

一种基于大模型知识图谱引导软件定义卫星错误修正方法

卫星系统错误修正方法软件定义卫星故障检测故障案例库

应急救援智能指挥决策系统评价指标体系构建方法与系统

决策系统评价指标体系贝叶斯模型构建系统评价指标筛选

一种用于反对抗系统的逆容积粒子滤波方法

容积粒子滤波观测噪声容积卡尔曼滤波状态更新电子对抗技术

一种基于元强化学习的高光谱开放集领域泛化方法

站点导航

APP 下载