摘要
本发明涉及一种基于随机蒸馏网络的无人机机动目标跟踪方法,属于无人机机动目标跟踪领域。包括:根据三维无人机机动目标跟踪场景构建动力学模型;将动力学模型抽象建模为马尔科夫决策过程,设计状态空间、动作空间及奖励函数;基于随机蒸馏网络的强化学习算法对马尔科夫决策过程求解奖励回报最大化的策略,使得无人机以最优轨迹跟踪机动目标。本发明针对三维目标跟踪场景,相比于二维场景更加真实,符合实际情况,能够更好地用于无人机系统中;在随机蒸馏网络的基础上增加一个预测器网络,进一步增大无人机的探索效率,使无人机能够更快地找到最优或次优解,加快收敛效率。
技术关键词
跟踪方法
蒸馏
强化学习算法
更新网络参数
计算机可执行指令
偏角
决策
无人机系统
超参数
可读存储介质
场景
策略更新
计算机程序产品
坐标
计算机系统
加速度
处理器
系统为您推荐了相关专利信息
图像智能识别方法
深层卷积神经网络
图像处理算法
随机梯度下降
资源受限环境
音频降噪方法
信噪比
降噪模型
噪声样本
计算机可执行指令
共享方法
强化学习策略
任务调度系统
多模态特征
上下文特征
轨迹跟踪方法
外骨骼机器人
外骨骼膝关节
电机编码器信息
人体髋关节
轻量化方法
蒸馏
交互注意力
适配器
Softmax函数