摘要
一种无人机实现移动人群感知的安全协同控制方法及系统,方法包括设定一个随机的动作探索过程,选择多无人机初始动作,基于多无人机移动人群感知模型计算奖励,建立经验池,更新多无人机状态;从经验池中抽取样本,计算多无人机数据收集的预期收益,并根据预期收益更新批评家网络;构建基于知识融合增强的语言表示ERNIE模型及斯塔克尔伯格博弈模型,通过斯塔克尔伯格博弈模型计算出的梯度进行梯度下降,并求解最小化梯度下降的结果;更新目标策略网络,增加不同的扰动,观察不同扰动下奖励值的波动,若满足收敛条件则保存当前策略,否则返回重新从经验池中抽取样本。本发明能够缓解无人机协同控制偏差带来的安全性和鲁棒性问题。
技术关键词
多无人机
斯塔克尔伯格博弈
协同控制方法
策略
飞行模型
网络
智能设备
协同控制系统
样本
数据
无人机协同
可读存储介质
损耗
能耗
模块
表达式
旋翼
传输路径
系统为您推荐了相关专利信息
智能问答系统
语义图谱
多模态响应
BERT模型
自然语言
决策优化方法
DQN算法
数学模型
风险预估模型
对象
出力曲线
充放电功率
典型日负荷曲线
粒子群算法求解
控制策略
文本分类方法
数据
深度语义分析
文本分类装置
自然语言