摘要
本发明提供一种手语视频的翻译方法、系统及计算机可读存储介质,首先通过预设的深度前馈编码模块对所获取的手语视频进行深度前馈编码以获取手语视频编码特征和预测手语词汇,再采用预设的深度前馈解码模块对所述手语视频编码特征进行深度前馈推理解码以获取预测词,并根据时间步将所述预测词连接为预测语句,而后将预测语句和所述手语词汇作为与所述手语视频对应的翻译信息档,如此,能够显著增强模型对复杂手语特征的捕捉能力,特别是手语动作的非线性关系表达,解决现有模型语义表达不准确、细节信息遗漏的问题,能够使生成的文本能更好地保留手语视频中的语义细节,提升翻译的可信度和精准度。
技术关键词
视频编码
翻译方法
解码模块
编码模块
多头注意力机制
语句
编解码
语义规则
视频帧
模组
非线性
弱监督学习
手语特征
可读存储介质
系统为您推荐了相关专利信息
协同感知方法
协同感知系统
点云特征
卷积神经网络提取
融合特征
意图识别方法
神经网络模型
加速度
海面船舶
图像
缩放单元
视频编码系统
图像处理单元
在线
标记单元