摘要
本发明提供一种异构多无人机数据协作近似动态规划最优一致方法及装置,涉及多智能体控制技术领域。该方法包括:获取异构多无人机系统的状态数据,构建带有补偿信号的识别器,逼近异构多无人机系统的动态模型信息,构建带有动态信号的补偿器,获得带补偿器识别神经网络的权值更新规则;根据权值更新规则,构建哈密尔顿函数;根据哈密尔顿函数,构建带有协作信号的累积平方误差;采用梯度下降法,获得累积执行‑协作评判神经网络的权值更新规则,计算相邻两次迭代常数权值;根据相邻两次迭代常数权值的误差,判断是否满足预设的阈值条件;若满足,停止迭代,输出异构多无人机系统最优一致的解。采用本发明可提高算法扩展性,降低算法复杂度。
技术关键词
异构多无人机
近似动态规划
识别神经网络
识别器
补偿器
梯度下降法
神经网络权值
计算机可读取存储介质
数据
误差
计算机可读指令
神经网络激活函数
智能体控制技术
多无人机系统
信号值