摘要
本发明公开了一种视频翻译方法、装置、计算机设备及存储介质,通过提取视频中的原始音频以及视频中的关键帧;根据所述原始音频以及所述关键帧,以判断是否在云端已提前存储翻译后的目标翻译音频;若判断没有提前存储翻译后的目标翻译音频,则将所述原始音频转换为目标翻译文本;提取所述原始音频特征,以根据所述目标翻译文本与提取到的所述原始音频特征合成目标翻译音频,其中,所述提取到的所述原始音频特征,包括对所述原始音频的语气特征进行提取;将所述原始音频替换为目标翻译音频。本申请通过判断云端存储目标翻译音频是否存在和分段翻译,从而最大化缩短视频翻译后加载时长,以提升用户视频观看的流畅度。
技术关键词
视频翻译方法
音频特征
文本
关键帧
翻译装置
计算机设备
音频输出模块
分段
云端
可读存储介质
处理器
存储器
动画
语义
校准
系统为您推荐了相关专利信息
可视特征
深度递归网络
时序特征
特征点集合
计算机系统
音频特征信息
编码器
计算机程序指令
时域音频信号
传播算法