一种基于多粒度跨模态对比学习的连续手语识别方法

AITNT
正文
推荐专利
一种基于多粒度跨模态对比学习的连续手语识别方法
申请号:CN202510009489
申请日期:2025-01-03
公开号:CN119863842B
公开日期:2025-10-03
类型:发明专利
摘要
一种基于多粒度跨模态对比学习的连续手语识别方法,首先充分挖潜手语视频与对应手语文本之间的隐性语义映射关系;接着利用多粒度跨模态对比机制去缓解冗余帧和语义无关标识词对跨模态对齐的潜在影响,通过粗粒度视频‑句子对比与细粒度帧‑词对比策略,从全局和局部角度对视觉与文本模态的特征进行有效对齐,通过跨粒度视频‑词对比和跨粒度帧‑句子对比策略来缓解冗余帧和语义无关标识词带来的语义干扰;最后利用视觉编码器中获得的视觉嵌入,通过解码器获得手语文本句子,作为预测的连续手语识别结果。本发明充分挖潜手语视频与对应手语文本之间的隐性语义映射关系,增强了手语模型对视觉上下文的语义理解,提高了手语识别的适用性和准确性。
技术关键词
连续手语识别方法 视频 跨模态 Softmax函数 一维卷积神经网络 卷积神经网络提取 序列特征 语义特征 视觉 解码器 文本编码器 标签 冗余 策略 标识 时序特征
系统为您推荐了相关专利信息
1
一种远程供电运维虚拟会议协作方法、系统及电子设备
会议协作 供电网络 节点 电力设备 运维
2
一种分布式超融合视觉AI架构设计方法与系统
架构设计方法 融合视觉 轻量级深度学习 数据中心 智能调度算法
3
心理健康支持音乐数据生成方法、系统、电子设备及存储介质
音乐数据生成方法 人脸特征数据 人工智能模型 心理健康 生命体征数据
4
一种面向番茄育种生物胁迫检测的改进鱼鹰搜索网络学习率优化方法
搜索算法 番茄 训练集 位置更新 通道注意力机制
5
一种噪声环境中语音数据库的智能构建系统及方法
智能构建方法 深度学习模型 声音活动检测 卷积神经网络算法 校验模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号