一种基于层级扩张注意力与多模态语义调和的无注释手语翻译方法

正文

推荐专利

申请号：CN202510888516

申请日期：2025-06-30

公开号：CN120805940A

公开日期：2025-10-17

类型：发明专利

摘要

本发明提供了一种基于层级扩张注意力与多模态语义调和的无注释手语翻译方法，涉及手语翻译技术领域。本发明对手语视频帧提取视觉特征并叠加位置编码，送入扩张注意力视觉编码器生成层级编码特征；训练阶段采用多模态语义调和损失对视觉特征与文本嵌入进行对齐；在文本解码器中执行交叉注意力融合并输出目标语言概率分布，结合交叉熵损失优化网络，最终生成译文序列。本发明实现无人工注释条件下对复杂手语语义的准确翻译。

技术关键词

手语翻译方法语义层级视觉特征交叉注意力机制解码器多模态手语翻译技术视频帧序列自然语言文本更新网络参数生成译文三元组编码特征样本

系统为您推荐了相关专利信息

一种时间一致的单目深度估计方法、模型及电子设备

单目深度估计方法局部纹理特征跨度计算机可读指令视频帧深度图

一种基于检索增强生成大模型的风机智能决策方法及系统

智能决策方法风机分片检索方法桶结构

一种短信内容的审核方法、装置、设备、存储介质和产品

审核方法关键性短信场景语义特征

基于自然语言转换技术实现的数据安全管理方法及设备

数据安全管控自然语言转换技术数据安全管理方法身份识别信息语句

通过机器视觉控制机械臂的脱模控制方法及系统

关键特征点点云图像机器视觉控制注塑模具脱模实时图像

一种基于层级扩张注意力与多模态语义调和的无注释手语翻译方法

站点导航

APP 下载