一种基于元深度强化学习的跳频干扰资源分配方法

正文

推荐专利

申请号：CN202410714914

申请日期：2024-06-04

公开号：CN118487625A

公开日期：2024-08-13

类型：发明专利

摘要

本公开实施例是关于一种基于元深度强化学习的跳频干扰资源分配方法，包括：根据通信对抗场景构建跳频干扰资源分配问题；将跳频干扰资源分配问题建模为马尔可夫决策过程；随机初始化元策略得到初始策略网络；基于MAML算法对初始策略网络进行元训练，元训练包括任务自适应阶段和元自适应阶段，其中，在任务自适应阶段，对初始策略网络的参数进行更新，并基于训练结果利用TRPO算法计算各干扰任务的损失函数，在元自适应阶段，最小化所有干扰任务的平均损失并得到优化后的分配策略；根据新的干扰任务对元训练优化后的分配策略进行微调。本公开实施例可以提升分配策略在动态环境中的快速自适应能力，实现对新跳频干扰资源分配任务的快速优化。

技术关键词

干扰资源分配方法深度强化学习策略接收端跳频干扰网络干扰加噪声阶段参数通信链路干扰设备算法决策损耗轨迹功率天线恶意干扰发射端

系统为您推荐了相关专利信息

一种基于自动门识别的智能巡检方法

自动门智能巡检方法巡检机器人实时监控系统智能巡检系统

一种多星协同多目标任务分配博弈决策方法及装置

任务分配模型博弈决策方法策略计算机设备空间飞行器

太阳能与中深层地热能耦合供热运行控制系统及运行方法

太阳能热源深层地热能储热组件电加热炉太阳能设备

一种三维重构驱动的启发式原木板材切割优化方法

原木板材启发式方法点云模型启发式搜索算法模拟退火算法

基于多模态感知的景区自适应音乐生成方法和系统

音乐生成方法强化学习模型生成音乐数据频谱特征网络

一种基于元深度强化学习的跳频干扰资源分配方法

站点导航

APP 下载