摘要
本发明提供一种基于强化学习的通信干扰策略生成方法,包括步骤一、构建通信方和通信干扰方的系统模型;步骤二、基于步骤一构建的通信方和通信干扰方的系统模型,采用赢或学习策略爬山法算法对通信方的抗干扰方案进行学习,设计相应的干扰决策模型;步骤三、采用步骤二得出的干扰决策模型,根据“观察‑调整‑决策‑行动”的决策过程,学习通信目标的抗干扰策略并实施干扰。本发明综合考虑干扰基本原则和通信目标行为变化,将干噪信比和通信目标受干扰后的改频、增大发射功率等抗干扰行为相结合,作为干扰效果的衡量指标,从而实现实时快速干扰的目的。
技术关键词
策略生成方法
决策
功率
抗干扰措施
信道
接收机
算法
速率
因子
指标
系统为您推荐了相关专利信息
接收线圈
效率控制系统
无线输电系统
LCC补偿网络
同步整流电路
车辆路径规划方法
RRT算法
智能决策方法
全局地图
车辆智能驾驶
LCL型滤波器
能量控制方法
谐波源模型
牵引供电系统
机车