摘要
本申请提供了一种博弈策略规划方法、系统、电子设备及存储介质,涉及人工智能技术领域,所述方法应用于多智能体,多智能体包括至少一个无人机和至少一个无人艇,所述方法通过实时获取目标博弈区域的环境数据、姿态数据、位置数据和博弈方数据,构建精确的环境模型及状态、动作空间,并运用蒙特卡洛算法与确定性策略梯度算法高效求解当前任务的目标函数,生成博弈反制策略集,并基于博弈反制策略集确定每个智能体执行当前任务的运动规划数据,控制每个智能体按规划执行任务,显著提升了多智能体的博弈反制策略生成准确性、任务分配准确性与任务执行效率。
技术关键词
确定性策略梯度
蒙特卡洛算法
数据
策略规划方法
环境监测传感器
激光雷达传感器
声呐传感器
无人艇
气象
子模块
定位单元
运动控制模块
参数
无人机
效能
电子设备
系统为您推荐了相关专利信息
大语言模型
智能问答系统
信息生成方法
管理服务系统
前端模块
概率预测方法
时间序列模型
历史气象数据
负荷预测模型
历史负荷数据
投饲设备
局部二值模式算法
计量方法
水产
水体环境污染