基于AI语音克隆与口型同步的视频生成方法及系统

正文

推荐专利

申请号：CN202510869614

申请日期：2025-06-26

公开号：CN120980180A

公开日期：2025-11-18

类型：发明专利

摘要

本申请实施例提供一种基于AI语音克隆与口型同步的视频生成方法及系统，所述方法可以在获取输入视频和输入文本后，先使用语音合成模型将输入视频的声纹特征与输入文本融合，以生成自然语音；再使用唇形位移模型解析输入视频的唇部关键点，以及按照唇部关键点，根据自然语音匹配唇形变化数据；再根据输入视频和唇形变化数据生成输出视频。所述方法可以将语音合成模型的音素时长预测与唇形位移模型通过时序卷积耦合，使输出视频的口型与语音内容匹配，并采用通过重绘唇部区域实现轻量化视频修复，还支持动态响应用户实时修改的输入文本，提高响应效率。

技术关键词

自然语音声纹特征韵律特征数据生成输出关键点语音识别文本视频生成方法 AI语音图像分割网络韵律模式关键词曲线特征提取模块视频生成系统执行语音识别注意力机制

系统为您推荐了相关专利信息

一种人体3D关键点检测方法以及相关设备

人体关键点人体形状参数关键点检测方法序列视频

基于特征融合的彩色点云配准方法及系统

特征描述符关键点点云配准方法子模块颜色误差

一种油气井勘探开发废弃物运输监管方法和系统

油气井勘探开发运输车辆监管方法站点迪杰斯特拉算法

车灯控制方法、装置、车辆和存储介质

车辆外部环境步态特征迎宾灯车灯控制方法身份

一种基于时序特征曲线的帕金森病步态对比分析方法

步态信息步态特征动态时间规整方法数字滤波器坐标

基于AI语音克隆与口型同步的视频生成方法及系统

站点导航

APP 下载