面向多智能体可信交互式决策控制的联邦强化学习系统、方法及设备

AITNT
正文
推荐专利
面向多智能体可信交互式决策控制的联邦强化学习系统、方法及设备
申请号:CN202411109882
申请日期:2024-08-13
公开号:CN118982061A
公开日期:2024-11-19
类型:发明专利
摘要
本发明公开了一面向多智能体可信交互式决策控制的联邦强化学习系统、方法及设备。系统框架采用基于机理模型的数据分析方法建立样本置信度综合量化指标,实现精准、全面、可解释的偏好建模,并依据偏好模型从目标对齐和协同优化角度,解构联邦强化学习算法,实现算法多层级解释;创新采用数据机理双驱动的混合视觉注意力模型,解决传统深度强化学习在城市复杂交通环境下的高维状态空间表征难题,实现高可用性算法表现;该系统将多智能体联邦强化学习协同优化过程建模为可解释的自组织性群体合作过程,通过偏好启发式参数聚合实现模型鲁棒性与样本效率之间的平衡,解决了城市自动驾驶算法可信任难题。
技术关键词
强化学习系统 面向多智能体 强化学习模型 神经网络参数 轨迹 特征提取器 样本 风险 模拟器 车辆横向控制 智能体交互 更新网络参数 方向盘控制 修剪策略 数据 注意力机制 语义 视觉注意力模型 速度
系统为您推荐了相关专利信息
1
一种实景数字地图驱动的配电网规划方案智能评估方法及系统
智能评估方法 配电网规划 权重计算方法 计算机可执行指令 实景地图
2
一种四轮无人驾驶车辆轨迹跟踪控制方法
状态空间方程 车辆轨迹跟踪 二次型规划 重构 误差模型
3
用于集成电路仿真分析的矩阵分解机器学习训练方法、装置、设备
节点导纳矩阵 机器学习训练方法 仿真分析 多层感知机 机器学习模型
4
一种基于场景仿真的高速公路出口匝道容错车道改进方法
仿真场景 风险 多模态 容错控制 车道
5
一种视频进度调节方法、装置及电子设备
视频进度调节方法 视频播放界面 速率 处理单元 终端屏幕
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号