摘要
本发明公开了一面向多智能体可信交互式决策控制的联邦强化学习系统、方法及设备。系统框架采用基于机理模型的数据分析方法建立样本置信度综合量化指标,实现精准、全面、可解释的偏好建模,并依据偏好模型从目标对齐和协同优化角度,解构联邦强化学习算法,实现算法多层级解释;创新采用数据机理双驱动的混合视觉注意力模型,解决传统深度强化学习在城市复杂交通环境下的高维状态空间表征难题,实现高可用性算法表现;该系统将多智能体联邦强化学习协同优化过程建模为可解释的自组织性群体合作过程,通过偏好启发式参数聚合实现模型鲁棒性与样本效率之间的平衡,解决了城市自动驾驶算法可信任难题。
技术关键词
强化学习系统
面向多智能体
强化学习模型
神经网络参数
轨迹
特征提取器
样本
风险
模拟器
车辆横向控制
智能体交互
更新网络参数
方向盘控制
修剪策略
数据
注意力机制
语义
视觉注意力模型
速度
系统为您推荐了相关专利信息
智能评估方法
配电网规划
权重计算方法
计算机可执行指令
实景地图
状态空间方程
车辆轨迹跟踪
二次型规划
重构
误差模型
节点导纳矩阵
机器学习训练方法
仿真分析
多层感知机
机器学习模型
视频进度调节方法
视频播放界面
速率
处理单元
终端屏幕