摘要
一种基于深度强化学习的避障追踪方法,属于路径规划领域。本发明为基于分布式强化学习框架的多无人机侦察近端策略优化方法,实现方法为:通过压力感知机制和改进的SAC强化学习方法的深度融合,实现对动态障碍的精准躲避和异常辐射源的高效追击。本发明设计的压力感知模块,将环境压力量化为数值指标,并据此动态调整决策策略的保守程度。在此基础上,利用改进的SAC算法的双Q网络架构进行决策优化,采用保守和激进两种策略并行评估,在保证探索效率的同时提升策略的鲁棒性。本发明在连续动作空间中运行,确保无人机运动轨迹的平滑性和稳定性。本发明能够在复杂城市电磁频谱作战中,实现无人机在高压环境下智能追击异常辐射源。
技术关键词
深度强化学习
压力感知模块
追踪方法
环境感知系统
障碍物
网格地图
网络
环境状态信息
无人机运动轨迹
分布式强化学习
二维坐标系统
连续动作空间
策略优化方法
闭环反馈机制
决策
参数
强化学习方法
系统为您推荐了相关专利信息
智能调度方法
强化学习模型
变电站电力设备
智能调度系统
信息抽取方法
采样机器人
采样点
执行机构
控制中心
监控传感器
空调节能控制方法
空调控制策略
深度强化学习
空调智能控制
意图
卷积神经网络模型
多普勒
卫星终端
变电站
监测方法