摘要
本发明公开了一种策略迭代算法及装置,涉及多智能体技术领域,用以解决现有涉及多个智能体之间协作与切换时,因拓扑关系无法修改导致团队协作无法体现的问题。该算法包括:根据追踪器在第步的第一状态、逃避器在第步的第一状态、在第步的状态改变量得到追踪器在第步的更新状态和逃避器在第步的更新状态;根据追踪器在第步的更新状态和逃避器在第步的更新状态确定追踪器与逃避器之间的第一距离,若第一距离满足交换公式,则根据交换公式对所述第一距离对应的边权进行交换,并更新邻接矩阵;若更新系统价值函数第一系统价值函数的差值绝对值小于错误阈值,将第步的更新控制策略确定为最终控制策略。
技术关键词
控制策略
迭代算法
更新系统
多智能体技术
计算机设备
处理器
矩阵
误差
追踪器
可读存储介质
存储器
代表
团队
符号
变量
关系
系统为您推荐了相关专利信息
调速器控制方法
光伏发电功率
水力发电
图像分割
调速器控制系统
深度图数据
激光点云数据
多相机系统
激光雷达
外参标定系统
预警模型
朴素贝叶斯分类器
文本编码器
分级预警方法
多标签