基于全模态对齐的手语翻译模型、系统及方法

AITNT
正文
推荐专利
基于全模态对齐的手语翻译模型、系统及方法
申请号:CN202511415426
申请日期:2025-09-30
公开号:CN120894834B
公开日期:2025-12-23
类型:发明专利
摘要
本发明公开了基于全模态对齐的手语翻译模型、系统及方法,包括:从输入视频中提取手部、面部及身体姿态的多模态特征并进行初步融合;继而通过多尺度时序编码与跨模态协同注意力机制进行深度二次融合与对齐,生成全模态对齐的时空特征序列;随后利用基于CTC的序列预测模型对该特征序列进行边界检测与动态分割,输出带时间戳的离散手语词序列;最后,将该序列经图结构增强的Transformer编码器捕获手语语法结构后,输入集成语法一致性损失的Transformer解码器,生成符合目标自然语言语法和语义规则的目标文本。本发明有效解决了连续手语动作粘连和语法结构差异问题,大幅提升了手语翻译的准确性和自然语言生成的流畅性。
技术关键词
手语翻译方法 连续手语 协同注意力 序列 语法结构 语义 自然语言文本 模态特征 面部关键点 跨模态 编码 姿态估计算法 身体 多尺度 翻译模型 姿态特征
系统为您推荐了相关专利信息
1
基于机器学习的平台大数据异常在线预警方法
在线预警方法 模型训练模块 高斯混合模型 预警模块 大数据
2
应用于热烈解制乙烯的DCS控制方法及系统
控制点 DCS系统 乙烯 时间序列分析技术 脱水控制模块
3
基于矿区污染物迁移行为建模的生态环境大数据处理方法
大数据处理方法 保护区 指数 居住区 生态
4
一种基于离线学习的多样化交互智能体构建系统
智能体交互 离线 循环系统 构建系统 系统协作
5
一种汽车线束加工用的切割方法
汽车线束 切割方法 驱动切割设备 数据交换协议 动态参数模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号