基于轻量掩码增强的手语翻译系统及方法

AITNT
正文
推荐专利
基于轻量掩码增强的手语翻译系统及方法
申请号:CN202510953210
申请日期:2025-07-10
公开号:CN120689936A
公开日期:2025-09-23
类型:发明专利
摘要
一种基于轻量掩码增强的手语翻译系统及方法,包括以下步骤:步骤1.采用帧间差分技术识别并剔除对动作表达无实质贡献的冗余帧,通过局部动态掩码模块进一步区分手语动作的前景和背景信息;步骤2.将经过轻量掩码模块优化后的手语视频输入至视觉模块;生成精确且全面的视觉特征;步骤3.将从视觉模块获得的视觉特征转换为适用于语言处理的语言特征;步骤4.语言模块接收由映射模块转换得到的语言特征,并结合编码器‑解码器模型mBART进行处理,提高输出文本的质量。本发明显著提升了手语到口语翻译的准确性与效率;不仅优化了计算资源的使用,还极大地增强了翻译结果的可读性和语义连贯性,为实现更加普及和便捷的手语交流提供了强有力的技术支持。
技术关键词
手语翻译方法 语言模块 视觉特征 手语翻译系统 解码器模型 时空特征信息 视频 注意力 差分技术 sigmoid函数 像素 识别二值化 编码器 融合特征 网络 光照 掩码技术
系统为您推荐了相关专利信息
1
基于VPX架构的视频矩阵模块实现方法
视频流 VPX架构 视频矩阵 卷积神经网络模型 时间段
2
基于图像识别的高耐盐水稻种植管理系统
种植管理系统 图像处理模块 数据采集模块 编码方法 融合特征
3
基于图学习和重构交互的多模态视频摘要模型及方法
视频摘要模型 视频摘要方法 重构 卷积模块 特征提取模块
4
一种基于视觉融合的低空无人机识别与反制方法及系统
低空无人机识别 反制方法 多模块 融合特征 多模态
5
视频语音生成模型的训练方法、视频合成方法及相关设备
语音生成模型 音频解码器 非易失性计算机可读存储介质 视频帧编码器 音频编码器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号