融合场景交互特征与分层时态建模的行人意图推理方法

正文

推荐专利

申请号：CN202511395703

申请日期：2025-09-28

公开号：CN120877254B

公开日期：2025-12-02

类型：发明专利

摘要

本申请提供一种融合场景交互特征与分层时态建模的行人意图推理方法，涉及自动驾驶技术领域，解决了现有技术中行人意图预测准确性和泛化能力不高的技术问题。该方法包括：获取人车距离数据、自车速度数据以及场景图片数据；对场景图片数据进行语义分割，识别并标识每个像素的对象属性，得到分割图像、边界框坐标、行人姿态关键点；边界框坐标为行人在分割图像中的位置；提取分割图像中的场景时序特征；基于边界框坐标、行人姿态关键点、人车距离数据、以及自车速度数据，提取时空关联的行人运动意图特征；采用分层时态策略对场景时序特征、时空关联的行人运动意图特征进行特征融合，并预测行人过街意图结果。本申请用于行人意图推理过程中。

技术关键词

时序特征运动意图 VGG网络融合场景人车高层次关键点推理方法交互特征坐标分层编码器图像数据引入注意力机制损失函数优化自动驾驶技术池化算法