摘要
本申请公开了一种基于强化学习的无人机规避策略确定方法、装置、设备及介质,涉及无人机自主控制技术领域,包括:构建无人机六自由度模型、动作库及当前处于飞行状态的其他飞行器的三自由度质点模型,对其他飞行器机动特性进行约束,根据相对运动态势实现其他飞行器对目标的跟踪。在编程语言平台搭建强化学习环境及模型,将无人机和其他飞行器的位置姿态信息输入模型,以输出飞行动作供无人机规避其他飞行器。若规避成功,则基于其他飞行器的机动区域态势给予模型奖励值。本申请基于其他飞行器机动态势量化的奖赏函数使无人机在训练中能更好地感知危险与动作效果,促使其采取更有效的规避动作,从而提升实际遭遇其他飞行器时的规避成功率。
技术关键词
强化学习模型
无人机规避
仿真平台
强化学习环境
策略
无人机自主控制技术
搭建模块
无人机模型
飞行器模型
构建无人机
输出模块
可读存储介质
处理器
电子设备
存储器
系统为您推荐了相关专利信息
强化学习方法
强化学习策略
视觉
语义
强化学习算法
效率协同优化系统
多模态特征
能耗特征
色母粒
数据
作业调度优化
货物提升机
作业调度方法
四向穿梭车
鲸鱼优化算法
DS证据理论
故障诊断方法
故障诊断模型
主成分分析算法
指标