摘要
本发明公开一种基于统一数据表示和深度强化学习的多无人机感知规避方法及系统,该方法步骤包括:步骤S01.多无人机系统中各无人机通过激光雷达获取距离测量信息,使用相邻无人机的激光测距距离模拟邻近无人机的激光雷达扫描数据,并将激光雷达扫描数据与通信数据进行融合形成统一数据表示;步骤S02.使用统一数据表示基于深度强化学习生成各无人机的规避控制策略,其中对无人机的观测包括统一的数据表示、目标相对位置和速度,无人机通过与环境交互更新网络参数以最大化累积奖励;步骤S03.各无人机按照规避控制策略动作。本发明能够提高多无人机系统碰撞规避的可靠性,增强无人机对周围环境的感知能力,同时能够提升环境适应性。
技术关键词
激光雷达扫描数据
规避方法
多无人机系统
深度强化学习算法
无人机感知规避系统
控制策略
集成激光雷达
激光雷达设备
更新网络参数
障碍物
线束
定义
存储计算机程序
代表
数据更新
系统为您推荐了相关专利信息
异构无人机
数据传输网络
策略优化方法
深度强化学习算法
邻居
智能调光照明系统
无人机平台
无人机飞行状态
LED光源阵列
照明模块
无人机集群协同
深度强化学习算法
搜索方法
无人机群协同
网格
驾驶决策模型
深度强化学习算法
决策方法
轨迹
行驶车辆
深度确定性策略梯度
深度强化学习算法
多头注意力机制
深度Q网络
组网场景