融合大模型的多模态行人指挥手势识别方法

正文

推荐专利

融合大模型的多模态行人指挥手势识别方法

申请号：CN202411492294

申请日期：2024-10-24

公开号：CN119360447B

公开日期：2025-10-21

类型：发明专利

摘要

本发明涉及一种融合大模型的多模态行人指挥手势识别方法，属于自动驾驶领域。其包括：收集行人数据集，并进行数据集划分；采用预训练的行人检测模型从数据集中提取人体关键点；通过目标追踪网络对提取的人体关键点信息进行处理，得到动态的关键点轨迹信息；建立用于识别手势的多模态动作识别模型，其至少包括骨架编码器和文本编码器；多部分对比学习损失训练优化多模态手势识别模型，得到识别结果。将训练好的模型安装至自动驾驶汽车上，对行人手势进行区分，准确判断行人的意图。本发明方法采用多模态框架，识别精度高、识别速度快。

技术关键词

手势识别方法文本编码器人体关键点多模态手势行人检测模型分支关节骨架特征动作识别模型标记轨迹行人手势识别卷积模块解码器双编码器 Softmax函数数据

系统为您推荐了相关专利信息

基于全局语义图的恶意语义对齐方法、系统及电子设备

对齐方法自然语言预处理社交媒体环境双向长短期记忆网络解析器

基于多模态信息融合的视频生成方法、装置、设备及介质

多模态信息融合视频生成方法去噪模型生成图像特征语义

宠物健康分析方法及装置、电子设备及存储介质

健康档案信息宠物健康融合特征样本图像特征提取

一种基于跟踪的人车交叉检测方法

风险评估模型车辆行人检测模型图像卡尔曼滤波器

一种户外场景下的步态数据实时采集方法

数据实时采集方法步态轨迹人体关键点遮挡关系场景

融合大模型的多模态行人指挥手势识别方法

站点导航

APP 下载