一种基于FFMPEG、TTS、Wav2Lip的自动化视频翻译系统

正文

推荐专利

申请号：CN202411846656

申请日期：2024-12-16

公开号：CN119830924A

公开日期：2025-04-15

类型：发明专利

摘要

本发明公开了一种基于FFMPEG、TTS、Wav2Lip的自动化视频翻译系统，涉及自动翻译处理技术领域，本发明包括视频处理单元、翻译合成单元和移动端，所述视频处理单元包括视频输入模块、视频采集模块、预处理模块、音频提取模块和视频提取模块；所述视频输入模块依次连接视频采集模块、预处理模块、音频提取模块和视频提取模块与翻译合成单元连接；本发明通过口型同步模块利用计算机视觉技术检测和追踪视频帧中人脸关键点，基于面部追踪结果提取相关语音特征等，通过图像到图像反馈循环等技术手段，确保翻译后的视频中人物口型与语音内容精准同步，使翻译后的视频看起来更加自然流畅，提升了观众的观看体验。

技术关键词

翻译系统视频采集模块可视化窗口视频输出模块视频处理单元输入模块音频语音识别模型面部特征点存储模块字幕语音特征图像文本移动端动画

一种基于FFMPEG、TTS、Wav2Lip的自动化视频翻译系统

站点导航

APP 下载