摘要
本发明公开了一种基于FFMPEG、TTS、Wav2Lip的自动化视频翻译系统,涉及自动翻译处理技术领域,本发明包括视频处理单元、翻译合成单元和移动端,所述视频处理单元包括视频输入模块、视频采集模块、预处理模块、音频提取模块和视频提取模块;所述视频输入模块依次连接视频采集模块、预处理模块、音频提取模块和视频提取模块与翻译合成单元连接;本发明通过口型同步模块利用计算机视觉技术检测和追踪视频帧中人脸关键点,基于面部追踪结果提取相关语音特征等,通过图像到图像反馈循环等技术手段,确保翻译后的视频中人物口型与语音内容精准同步,使翻译后的视频看起来更加自然流畅,提升了观众的观看体验。
技术关键词
翻译系统
视频采集模块
可视化窗口
视频输出模块
视频处理单元
输入模块
音频
语音识别模型
面部特征点
存储模块
字幕
语音特征
图像
文本
移动端
动画