一种基于多粒度跨模态对比学习的连续手语识别方法

正文

推荐专利

申请号：CN202510009489

申请日期：2025-01-03

公开号：CN119863842B

公开日期：2025-10-03

类型：发明专利

摘要

一种基于多粒度跨模态对比学习的连续手语识别方法，首先充分挖潜手语视频与对应手语文本之间的隐性语义映射关系；接着利用多粒度跨模态对比机制去缓解冗余帧和语义无关标识词对跨模态对齐的潜在影响，通过粗粒度视频‑句子对比与细粒度帧‑词对比策略，从全局和局部角度对视觉与文本模态的特征进行有效对齐，通过跨粒度视频‑词对比和跨粒度帧‑句子对比策略来缓解冗余帧和语义无关标识词带来的语义干扰；最后利用视觉编码器中获得的视觉嵌入，通过解码器获得手语文本句子，作为预测的连续手语识别结果。本发明充分挖潜手语视频与对应手语文本之间的隐性语义映射关系，增强了手语模型对视觉上下文的语义理解，提高了手语识别的适用性和准确性。

技术关键词

连续手语识别方法视频跨模态 Softmax函数一维卷积神经网络卷积神经网络提取序列特征语义特征视觉解码器文本编码器标签冗余策略标识时序特征

系统为您推荐了相关专利信息

一种远程供电运维虚拟会议协作方法、系统及电子设备

会议协作供电网络节点电力设备运维

一种分布式超融合视觉AI架构设计方法与系统

架构设计方法融合视觉轻量级深度学习数据中心智能调度算法

心理健康支持音乐数据生成方法、系统、电子设备及存储介质

音乐数据生成方法人脸特征数据人工智能模型心理健康生命体征数据

一种面向番茄育种生物胁迫检测的改进鱼鹰搜索网络学习率优化方法

搜索算法番茄训练集位置更新通道注意力机制

一种噪声环境中语音数据库的智能构建系统及方法

智能构建方法深度学习模型声音活动检测卷积神经网络算法校验模块

一种基于多粒度跨模态对比学习的连续手语识别方法

站点导航

APP 下载