一种基于元学习和经验向量的自动驾驶联邦强化学习方法

正文

推荐专利

申请号：CN202411590392

申请日期：2024-11-08

公开号：CN119442908B

公开日期：2025-09-12

类型：发明专利

摘要

本发明公开了一种基于元学习和经验向量的自动驾驶联邦强化学习方法，包括：构建自动驾驶异质环境；构建Actor网络，通过确定性策略梯度更新Actor网络参数；构建Critic网络，通过元学习算法和误差反向传播算法更新Critic网络参数，训练过程中还加入经验向量整合并更新各自动驾驶车辆的学习经验，以优化全局策略的性能表现；在训练过程中，所有自动驾驶车辆定期将本地Critic网络参数、Actor网络参数和本地经验向量发送至中央服务器聚合。本发明通过提高自动驾驶车辆对环境异质性的适应能力，解决现有联邦强化学习中因环境动态变化和策略性能波动带来的收敛速度变慢和策略泛化能力下降问题，从而提升训练效率和策略鲁棒性。

技术关键词

强化学习方法确定性策略梯度虚拟仿真环境车辆参数策略更新元学习方法元学习算法城市道路误差反向传播异质可读存储介质频率数据处理器网络控制雨天噪声

系统为您推荐了相关专利信息

基于深度卷积神经网络的化成箔外观缺陷的分类方法

化成箔深度卷积神经网络分类方法图片样本

一种电压监测仪智能校准系统

智能校准系统电压监测仪温度补偿系数样本递归最小二乘算法

一种U型高效多模态隐写方法、系统及介质

隐写方法多模态模块载体网络深度

一种电能表故障检测方法、装置、终端设备及计算机可读存储介质

抗干扰滤波器判断电能表故障特征温湿度电压

一种高炉热电偶检测修正方法及系统、计算机设备及介质

检测修正方法高炉热电偶材料物性参数数据高炉炉缸侵蚀程度

一种基于元学习和经验向量的自动驾驶联邦强化学习方法

站点导航

APP 下载