摘要
本发明属于深度强化学习自动驾驶领域,涉及车辆安全决策技术,具体是一种基于多模态时空表征的级联深度强化学习安全决策方法,其先构建了一个多模态时空感知编码器从多模态连续输入中联合建模空间和运动信息,以获取动态驾驶场景的当前感知表征;而后,引入未来预测编码器从当前感知表征中捕获不同交通参与者之间的交互,获取未来预测表征;而后,连接当前感知表征和未来预测表征形成多模态时空表征并作为强化学习的状态输入,以全面把握场景,并结合分布式PPO算法,在针对安全决策设计的奖励函数指导下实现安全决策任务。本发明具有很高的环境适应性和决策成功率,能够在稠密交通场景中以及突发事件下实现智能汽车的主动安全决策任务。
技术关键词
深度强化学习
决策方法
执行矩阵乘法
网络
预测特征
注意力
预测编码器
激光雷达点云
级联
偏差
分支
图像特征提取
多任务
多模态特征融合
系统为您推荐了相关专利信息
深度图
超分辨率网络
特征提取模块
多模态
多尺度特征融合
画像
笔迹特征
神经网络结构
美术
个性化学习路径
智能预测方法
高压旋喷桩施工
水泥土
无侧限抗压强度
定量水
动态通道管理
网络质量指标
实时通信方法
退避算法
服务端
人体建模方法
体态信息
神经网络模型
服装
覆盖率