基于强化学习的集群协同围猎方法

正文

推荐专利

基于强化学习的集群协同围猎方法

申请号：CN202411843604

申请日期：2024-12-14

公开号：CN119687727A

公开日期：2025-03-25

类型：发明专利

摘要

本发明属于强化学习的技术领域，具体公开了一种基于强化学习的集群协同围猎方法，包括：初始化围猎智能体的策略神经网络和进攻智能体的初始状态；在围猎智能体和进攻智能体各自执行所选取动作后，确定围猎智能体获得的奖励并基于奖励更新策略神经网络的动作价值函数和状态价值函数，以对策略神经网络进行训练；在策略神经网络的目标损失函数收敛的情况下，将策略神经网络迁移到博弈对抗场景中进行测试；基于策略神经网络围猎智能体在场景测试中达到集群协同围猎要求的情况下，确定策略神经网络实现了围猎智能体的集群协同围猎。本方案解决了不对称条件下围猎双方的混合纳什均衡策略求解的技术难题。

技术关键词

集群场景神经网络硬件纳什均衡策略马尔可夫模型编码模块测试模块决策探测器矩阵损耗样本载体参数

系统为您推荐了相关专利信息

智能变电站过程层交换机性能测试系统、方法及设备

性能测试系统智能变电站电网暂态交换机全景数据采集

自适应上下文感知的车辆目标跟踪识别系统

跟踪识别系统多模态信息车辆动态特征提取模块

基于交互式多媒体编辑与云渲染技术的数字人合成系统

交互式多媒体渲染技术多模态交互编辑云渲染

基于逐级知识蒸馏的目标检测模型压缩方法

检测模型压缩方法学生教师检测头标签

温湿度控制器及控制方法及系统

温湿度控制器温湿度传感器单元数据加密算法传感器监测分析模块

基于强化学习的集群协同围猎方法

站点导航

APP 下载