摘要
本发明公开了一种强化学习地物杂波环境下低速目标自适应MTI方法,属于雷达信号处理领域。本发明利用强化学习对低速目标MTI滤波器组进行筛选,自适应选出对低速目标具有最优改善因子的滤波器。算法维护左右两个边界,对应阻带边缘频率最低和最高的滤波器,每次循环根据这两个边界计算左分割索引和右分割索引,以及这两个索引对应滤波器的改善因子,作为当前状态输入DQN进行动作预测。动作空间包含两种动作,动作一将左边界更新为左分割索引;动作二将右边界更新为右分割索引。重复收缩左右边界,直至左右边界重合,算法返回当前索引对应的滤波器。本发明利用强化学习,减少了滤波次数,并且具有准确筛选出最优滤波器的能力。
技术关键词
滤波器
杂波环境
强化学习模型
索引
因子
序列
决策
样本
脉冲重复频率
标签
信号处理
计算方法
数据
多普勒
训练集
算法
速度
参数