摘要
本发明公开了一种面向大决策空间的高效抗干扰模型及学习方法。考虑一个集中式决策的无线通信抗干扰场景,通信方包括一个接收机和n个发射机,干扰方仅包含一个模式化的干扰机。接收机进行集中式决策,其决策空间的大小随发射机数目呈指数增长。为解决传统的抗干扰决策方法在面对大决策空间时性能不佳的问题,本发明设计了一种面向大决策空间的高效抗干扰学习方法,在传统的神经网络的基础上,引入动作分支架构对决策空间进行分解,将指数级增长的输出节点的数目降为线性增长;设计基于非法动作屏蔽的顺序决策机制,通过剔除非法动作来缩小合法动作空间,从而加速算法收敛。本发明模型完备,物理意义清晰,算法设计合理有效,能够很好地刻画大决策空间下的智能通信抗干扰场景。
技术关键词
高效抗干扰
发射机
学习方法
无线通信抗干扰
接收机
分支
加速算法
定义
通信信道
指数
衰落模型
学习系统
策略
决策方法
机制
处理器
线性