摘要
本发明提出了一种融合手势标注的编辑式非自回归手语翻译方法及装置,其中该方法包括:获取视觉特征序列、对应的手势标注和译文,以生成训练数据集;构建神经网络模型,将训练数据集输入到神经网络模型进行训练,以得到训练好的非自回归手语翻译模型,其中,在训练过程中采用以译文为中心和以手势标注为中心的双中心学习策略以及采用关键帧手势标注替换方式引入噪声进行训练;获取待翻译的视觉特征序列,并将其输入到训练好的非自回归手语翻译模型进行手势标注预测、文本删除和文本插入,以得到翻译结果;由此,通过将手势标注作为编辑生成译文的初始序列,使模型能够在保持非自回归模型推理速度优势的同时,显著提升翻译性能。
技术关键词
神经网络模型
手势
手语翻译方法
视觉特征
手语翻译装置
序列
关键帧
翻译模型
生成训练数据
文本
噪声
编辑
分类器
时序
生成译文
重构
解码
编码器
模块
系统为您推荐了相关专利信息
图像处理算法
卷积神经网络模型
机器学习算法
构建卷积神经网络
储层参数
双参量传感器
弹性体结构
纳米银粉
球囊导管
评估装置
尿液监测系统
尿液采集装置
神经网络模型
数据采集模块
数据分析模块
迁移学习策略
气象观测数据
超短期太阳辐射预测方法
历史气象数据
融合特征
网络安全监测系统
攻击检测模块
网络通信
数据处理模块
网络节点