一种交互场景下的多智能体协同交互决策与控制方法

正文

推荐专利

申请号：CN202510880327

申请日期：2025-06-27

公开号：CN120386386B

公开日期：2025-08-29

类型：发明专利

摘要

本发明提出一种交互场景下的多智能体协同交互决策与控制方法，首先各智能体获取对抗场景的时序状态信息；在各智能体的决策系统中，获取的对抗场景时序状态信息输入LSTM网络进行预测和特征提取，得到隐藏状态，将隐藏状态输入到SAC强化学习模型中，并通过设计的奖励函数对LSTM网络以及SAC强化学习模型进行训练，最终得到各智能体的机动决策动作向量；各智能体以机动决策动作向量作为控制目标值，依据离散增量式PID控制器对智能体进行控制。该方法基于多智能体SAC强化学习算法，结合了LSTM时序处理和双经验回放机制，并通过设计合理的奖励函数机制，在具有复杂动态物体的环境中，能够快速预测动态物体的运动轨迹，对自身连续动作量进行准确决策。

技术关键词

强化学习模型决策系统场景动态物体时序网络强化学习算法速度动能坐标轨迹机制处理器可读存储介质存储器控制器典型电子设备程序

系统为您推荐了相关专利信息

一种基于正则化神经网络和动态加权的脑卒复发预测方法

复发预测方法 LSTM神经网络卷积神经网络提取患者数据噪声

车辆行驶时的参考线生成方法、装置、电子设备及车辆

车道线信息虚拟道路边界点云信息线生成方法生成虚拟车道线

一种基于状态空间模型的序列多模态场景识别方法

状态空间模型描述符多模态激光雷达传感器序列

一种基于注意力引导的多尺度信息融合的实时性语义分割方法

语义分割方法注意力多尺度特征分支采样模块

文档编辑方法、装置、设备、介质和产品

数据格式文档编辑方法生成提示信息分片存储服务器

一种交互场景下的多智能体协同交互决策与控制方法

站点导航

APP 下载