摘要
本发明公开了一种基于深度强化学习的最优跳频序列生成方法,属于人工智能和通信技术领域,步骤如下:获取目标生成跳频序列的频隙q、序列长度N和序列每次填充的步长,其中,步长为序列长度N的素因子;利用深度神经网络DNN指导蒙特卡洛树进行序列填充,生成跳频序列结果;重复生成跳频序列结果,并构建跳频序列训练集;对深度神经网络DNN进行训练和更新,得到训练好的深度神经网络DNN;根据目标生成跳频序列的频隙q、序列长度N和序列每次填充的步长,利用蒙特卡洛树和训练好的深度神经网络进行序列扩展填充,直至得到最优跳频序列。本发明解决了现有跳频序列生成方法动态调整和改进生成序列的能力不足的问题。
技术关键词
跳频序列生成方法
深度神经网络
深度强化学习
节点
蒙特卡洛树
图像
表达式
空间特征提取
元素
分支
时延
训练集
度量
因子
无噪声
周期
顶点