摘要
本发明涉及一种基于强化学习的空天地一体化网络抗干扰通信方法,包括:针对无人机和地面用户之间的通信链路、以及无人机和低轨卫星之间的通信链路分别构建智能体;根据发送端和接收端之间的每个可用信道在当前时隙的平均接收功率构建智能体的状态空间;根据发送端和接收端之间的传输信道集合和传输功率集合构建智能体的动作空间;根据发送端和接收端之间链路的接收信号干扰加噪声比构建智能体的奖励函数;以所有智能体的累计折扣奖励最大为优化目标构建目标优化模型;利用基于相似性度量的分布式Q学习算法和构建的目标优化模型对智能体进行训练,以使各智能体学习最优的通信策略;智能体根据观测到的状态通过学习到的最优通信策略输出发送端和接收端之间最优的传输信道和传输功率。本发明能够适应SAGIN下干扰源动态变化、网络拓扑时变的环境,提高抗干扰通信的实时性和有效性,同时降低强化学习的计算复杂度,加速学习收敛,进而在SAGIN中实现轻量化部署,保障卫星、无人机、地面用户之间的持续稳定通信。
技术关键词
抗干扰通信方法
信号干扰加噪声比
分布式Q学习算法
接收端
信道
通信链路
远程监控程序
地面
干扰无人机
功率
策略
空天地一体化网络
构建无人机
抗干扰通信系统
计算机存储介质
度量
波束成形
学习方法
系统为您推荐了相关专利信息
联合信源信道编码
信道条件信息
混合域
注意力参数
条带
人工智能模型
弹性调度方法
异构
弹性调度系统
镜像