一种用于自动驾驶系统的个性化强化学习决策方法

正文

推荐专利

申请号：CN202510149183

申请日期：2025-02-11

公开号：CN120087445A

公开日期：2025-06-03

类型：发明专利

摘要

本发明公开了一种用于自动驾驶系统的个性化强化学习决策方法，包括以下步骤：构建侵入性、效率性和安全性奖励函数，建立多维度个性化环境奖励模型；基于驾驶风格特征，选择合适的多步时序差分算法步长；通过优先经验回放机制对训练样本进行加权采样；引入基于风险评估的安全检查机制，动态评估自车与障碍车辆之间的交互风险；对不同驾驶风格分别训练独立的强化学习决策网络；验证不同性格决策框架的性能表现。本发明采用上述一种用于自动驾驶系统的个性化强化学习决策方法，通过结合多步时序差分算法、优先经验回放机制和风险评估机制，显著提升了自动驾驶系统的安全性、效率性和策略鲁棒性，能够更精准地适应复杂交通环境中的个性化驾驶需求。

技术关键词

自动驾驶系统决策方法差分算法风格机制车辆风险高速公路场景强化学习策略车道中心线动态时序驾驶者样本框架网络交通低密度

系统为您推荐了相关专利信息

气胸预测系统、方法、电子设备及介质

预测系统气胸视频帧编码器时序特征

一种垂直起降通用飞行器

垂直起降通用飞行器燃烧器组件燃气喷射组件氧气储罐

一种实时视频敏感内容识别方法及系统

敏感内容识别方法自定义规则卷积神经网络模型音频多层次特征

双平面影像脊柱关键点三维定位方法和系统

三维定位方法椎体视觉特征关键点影像

基于改进YOLOv8骨干网络的木板封边缺陷模型优化方法

模型优化方法木板网络滑动平均值样本

一种用于自动驾驶系统的个性化强化学习决策方法

站点导航

APP 下载