摘要
本申请实施例提供一种视频转译方法,包括:将原始视频分离成驱动视频和驱动音频;对所述驱动视频进行光影处理;在所述驱动音频中提取音色片段和对应的时间戳,在所述时间戳内的音色片段对应的音频进行翻译;和通过口型驱动模型对光影处理后的所述驱动视频和翻译处理后的所述驱动音频进行合成推理,形成合成视频。本申请实施例提供的视频转译方法,通过对参与者的语音进行实时识别,提取其语言信息并进行翻译,并基于口型驱动模型与对应的视频进行结合,从而使得视频翻译结果更加生动自然,增强观看体验。本申请实施例还提供一种视频转译装置和电子设备。
技术关键词
转译方法
视频
音频
转译装置
人脸关键点提取
电子设备
可读存储介质
处理器
算法
色彩
模块
存储器
计算机
语音
场景
程序
系统为您推荐了相关专利信息
注意力机制
多尺寸
置信度阈值
视频流
多尺度特征
实时状态信息
紧急救援信息
实时图像信息
实时位置
平板
脑电信号分类
机械臂控制方法
运动想象脑电信号
视频流
控制模块
主控芯片
HDMI信号处理
音频功放芯片
显示驱动电路
输入接口