摘要
本申请涉及一种多任务风险泛化的分布式多无人机策略获取方法及装置,通过采用训练好的风险知识提取网络根据局部观测数据以及历史数据,提取局部观测数据中的环境风险知识,再利用训练好的风险态度选择器根据环境风险知识,生成策略价值分布以及风险态度,利用策略生成网络根据风险态度在策略价值分布中选择对应的区域,生成以风险态度为导向的最优策略。采用本方法可以将对已知任务的学习到的风险知识迁移至未知任务中,从而得到适应于未知任务的最优策略。
技术关键词
策略获取方法
风险
多无人机
混合网络
多任务
多层感知器
离线
无人机集群
数据获取模块
注意力机制
在线
解码器
算法
误差
框架
系统为您推荐了相关专利信息
智能预警方法
预警模型
样本
计算机可执行指令
训练集
风险评估方法
柔性压力传感
微循环
数据处理单元
温度监测模块
车辆运行状态
车辆运行数据
实时检测方法
深度学习模型
样本
翻译平台
智能写作
行业术语
智能学习技术
版本控制功能