摘要
本发明提出了一种基于慢时间相位编码的汽车毫米波雷达干扰抑制方法,该方法基于强化学习的思想,通过优化相邻脉冲之间的相位编码以达到更好的相干干扰抑制效果。主要内容如下:建立汽车毫米波雷达在相干干扰抑制场景下的马尔可夫决策过程;推导干扰抑制场景下马尔可夫决策过程奖励函数;根据多个时间步的累积观测,设计相干干扰抑制场景下马尔可夫决策过程中的观测矩阵;根据脉间相位编码场景设计强化学习算法,得到满足合理概率分布的动作采样输出;结合环境部分可观测的问题,设计策略网络和价值网络;设置训练参数,训练网络,将训练好的网络作为相干干扰抑制的决策输出,并进行结果评估。
技术关键词
汽车毫米波雷达
时间相位编码
强化学习算法
干扰抑制方法
概率密度函数
相位编码方法
决策
多普勒
编码场景
恒虚警检测
索引
矩阵
策略
网络架构
编码模块
回波
信号