摘要
本发明属于无人机控制技术领域,提供一种基于深度强化学习的无人机多任务控制方法,具体过程为:训练数据生成:构建定点控制任务的任务环境,在该环境中完成定点控制任务的控制器训练;构建避障任务的任务环境,在该环境中完成避障任务控制器训练;利用训练完成的定点控制任务的控制器和避障任务控制器,生成用于多任务智能体离线训练的交互数据;多任务智能体离线训练:利用所述交互数据进行多任务智能体离线训练;多任务智能体在线训练:构建多个单任务环境,将多任务智能体与所述多个单任务环境直接交互,利用所述交互数据进行多任务智能体的在线训练;利用训练好的多任务智能体作为无人机位置控制器,执行无人机多任务控制。
技术关键词
多任务控制方法
深度强化学习
位置控制器
网络
离线
强化学习算法
障碍物
策略
无人机控制技术
在线
数据
阶段
速度
指令
推力
机体