面向多智能体可信交互式决策控制的联邦强化学习系统、方法及设备

正文

推荐专利

申请号：CN202411109882

申请日期：2024-08-13

公开号：CN118982061A

公开日期：2024-11-19

类型：发明专利

摘要

本发明公开了一面向多智能体可信交互式决策控制的联邦强化学习系统、方法及设备。系统框架采用基于机理模型的数据分析方法建立样本置信度综合量化指标，实现精准、全面、可解释的偏好建模，并依据偏好模型从目标对齐和协同优化角度，解构联邦强化学习算法，实现算法多层级解释；创新采用数据机理双驱动的混合视觉注意力模型，解决传统深度强化学习在城市复杂交通环境下的高维状态空间表征难题，实现高可用性算法表现；该系统将多智能体联邦强化学习协同优化过程建模为可解释的自组织性群体合作过程，通过偏好启发式参数聚合实现模型鲁棒性与样本效率之间的平衡，解决了城市自动驾驶算法可信任难题。

技术关键词

强化学习系统面向多智能体强化学习模型神经网络参数轨迹特征提取器样本风险模拟器车辆横向控制智能体交互更新网络参数方向盘控制修剪策略数据注意力机制语义视觉注意力模型速度

系统为您推荐了相关专利信息

一种实景数字地图驱动的配电网规划方案智能评估方法及系统

智能评估方法配电网规划权重计算方法计算机可执行指令实景地图

一种四轮无人驾驶车辆轨迹跟踪控制方法

状态空间方程车辆轨迹跟踪二次型规划重构误差模型

用于集成电路仿真分析的矩阵分解机器学习训练方法、装置、设备

节点导纳矩阵机器学习训练方法仿真分析多层感知机机器学习模型

一种基于场景仿真的高速公路出口匝道容错车道改进方法

仿真场景风险多模态容错控制车道

一种视频进度调节方法、装置及电子设备

视频进度调节方法视频播放界面速率处理单元终端屏幕

面向多智能体可信交互式决策控制的联邦强化学习系统、方法及设备

站点导航

APP 下载