摘要
本申请提供一种融合场景交互特征与分层时态建模的行人意图推理方法,涉及自动驾驶技术领域,解决了现有技术中行人意图预测准确性和泛化能力不高的技术问题。该方法包括:获取人车距离数据、自车速度数据以及场景图片数据;对场景图片数据进行语义分割,识别并标识每个像素的对象属性,得到分割图像、边界框坐标、行人姿态关键点;边界框坐标为行人在分割图像中的位置;提取分割图像中的场景时序特征;基于边界框坐标、行人姿态关键点、人车距离数据、以及自车速度数据,提取时空关联的行人运动意图特征;采用分层时态策略对场景时序特征、时空关联的行人运动意图特征进行特征融合,并预测行人过街意图结果。本申请用于行人意图推理过程中。
技术关键词
时序特征
运动意图
VGG网络
融合场景
人车
高层次
关键点
推理方法
交互特征
坐标
分层
编码器
图像
数据
引入注意力机制
损失函数优化
自动驾驶技术
池化算法