摘要
本发明公开了一种基于强化学习的通信对抗干扰策略分配方法,包括以下步骤:S1:建立无线通信对抗场景模型;S2:构建与对抗场景交互的马尔科夫决策过程模型;S3:建立包含评估网络、目标网络和策略网络的干扰资源分配模型;S4:组合并训练前述无线通信对抗场景模型、马尔可夫决策过程模型以及深度强化学习模型,完成干扰策略分配。本发明基于强化学习技术,通过构建并训练强化学习模型,达到准确、快速实现干扰策略分配的目的。
技术关键词
深度强化学习模型
策略
网络
资源分配
通信链路
决策
建立无线通信
错误率
场景
深度强化学习方法
梯度下降法
参数
符号
更新方法
强化学习技术
回收池
机器学习方法
系统为您推荐了相关专利信息
风险评估方法
卷积神经网络模型
风险评估系统
桥梁
数据
特征提取网络
融合算法
输出特征
标记缺陷
吊取重物
有序充电调度方法
模拟退火遗传算法
充电调度系统
模拟退火优化
动态