摘要
本申请提供一种基于深度强化学习的低同步开销的智能跳频块级决策方法,方法包括:步骤1,建立块级跳频模式决策抗干扰系统模型和确定优化目标;步骤2,以频谱瀑布图为状态,以跳频模式的选择和动态块长为动作,将块级跳频模式决策抗干扰过程建模为马尔可夫决策过程;步骤3,发射机选择动作,确定跳频模式和块长,执行选择的动作之后,获得线性缩放区间奖励,感知当前频谱,状态转移到下一状态,并将当前数据为经验,存储到经验池中;步骤4,从经验池中随机批量采样训练神经网络,并计算目标Q值,更新目标网络参数;步骤5,训练直至到最大次数;本申请实现了同步开销降低、交互频率减少及算法复杂度下降三重优化。
技术关键词
抗干扰系统
跳频模式
训练神经网络
深度强化学习
决策方法
跳频技术
贪婪算法
通信系统
动态
发射机
接收机
干扰特征
信道
贪婪策略
定义
线性
参数
系统为您推荐了相关专利信息
风力发电厂
发电量
交易方法
绿证交易
风力发电数据
快速原型
特征提取网络
训练神经网络
样本
识别方法
群智感知
深度强化学习模型
路径规划方法
无人机
空气质量监测器
条纹投影图像
训练神经网络模型
训练集
亮度
神经网络参数
培训系统
数据同步
低空飞行器
培训设备
数据传输协议