一种用于自动驾驶系统的个性化强化学习决策方法

AITNT
正文
推荐专利
一种用于自动驾驶系统的个性化强化学习决策方法
申请号:CN202510149183
申请日期:2025-02-11
公开号:CN120087445A
公开日期:2025-06-03
类型:发明专利
摘要
本发明公开了一种用于自动驾驶系统的个性化强化学习决策方法,包括以下步骤:构建侵入性、效率性和安全性奖励函数,建立多维度个性化环境奖励模型;基于驾驶风格特征,选择合适的多步时序差分算法步长;通过优先经验回放机制对训练样本进行加权采样;引入基于风险评估的安全检查机制,动态评估自车与障碍车辆之间的交互风险;对不同驾驶风格分别训练独立的强化学习决策网络;验证不同性格决策框架的性能表现。本发明采用上述一种用于自动驾驶系统的个性化强化学习决策方法,通过结合多步时序差分算法、优先经验回放机制和风险评估机制,显著提升了自动驾驶系统的安全性、效率性和策略鲁棒性,能够更精准地适应复杂交通环境中的个性化驾驶需求。
技术关键词
自动驾驶系统 决策方法 差分算法 风格 机制 车辆 风险 高速公路场景 强化学习策略 车道中心线 动态 时序 驾驶者 样本 框架 网络 交通 低密度
系统为您推荐了相关专利信息
1
气胸预测系统、方法、电子设备及介质
预测系统 气胸 视频帧 编码器 时序特征
2
一种垂直起降通用飞行器
垂直起降通用飞行器 燃烧器组件 燃气 喷射组件 氧气储罐
3
一种实时视频敏感内容识别方法及系统
敏感内容识别方法 自定义规则 卷积神经网络模型 音频 多层次特征
4
双平面影像脊柱关键点三维定位方法和系统
三维定位方法 椎体 视觉特征 关键点 影像
5
基于改进YOLOv8骨干网络的木板封边缺陷模型优化方法
模型优化方法 木板 网络 滑动平均值 样本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号