摘要
本发明属于模式识别技术领域,公开了一种基于元强化学习的高光谱开放集领域泛化方法。首先,为实现稳健的开放集识别策略学习,本发明使用背景像素模拟虚拟未知类,并使用元学习的情景模拟机制对源域中的开放集识别场景进行模拟。在情景模拟过程中,将开放集识别任务建模为内部马尔可夫决策过程,利用强化学习的反馈学习和策略优化机制,迭代优化开集识别策略。其次,为实现源域向未见目标域稳健的跨域知识迁移,本发明将跨任务知识归纳建模为外部马尔可夫决策过程,设计了不变风险奖励机制来鼓励智能体在不同的开放集识别任务中捕获跨任务共享知识。引入了Mamba作为记忆策略网络,利用其强大的上下文压缩能力实现了跨任务共享知识归纳。
技术关键词
强化学习环境
泛化方法
决策
识别策略
状态空间模型
记忆
图像块
网络
模式识别技术
参数
样本
空谱特征
动作策略
轨迹
机制
矩阵
编码器
情景
像素
系统为您推荐了相关专利信息
避障控制系统
决策系统
巡检机器人
激光雷达点云数据
电机驱动单元
节点
实体
关系
病历知识图谱构建
实验室信息管理系统
卫星系统
错误修正方法
软件定义卫星
故障检测
故障案例库
决策系统
评价指标体系
贝叶斯模型
构建系统
评价指标筛选
容积粒子滤波
观测噪声
容积卡尔曼滤波
状态更新
电子对抗技术