视频内容修改方法、装置、电子设备及存储介质

正文

推荐专利

申请号：CN202411842689

申请日期：2024-12-13

公开号：CN119653198A

公开日期：2025-03-18

类型：发明专利

摘要

本发明提供一种视频内容修改方法、装置、电子设备及存储介质，涉及多媒体技术领域，该方法包括：提取原始视频中目标人物的初始音频，根据初始音频提取目标人声和音频文本；修改音频文本获得目标文本，根据目标文本和目标人声合成目标音频；根据目标音频录制面部口型视频，获得驱动视频；根据驱动视频和目标音频进行口型校准，获得标准驱动视频；将标准驱动视频和原始视频输入隐式关键点驱动模型，获得合成视频。本发明通过录制面部驱动视频来提供自然的口型、表情和头部姿态，使得生成的视频在口型方面更加逼真和流畅，确保最终的视频效果更加符合期望，驱动视频和音频通过在隐空间内进行推理和训练，提高了视频生成的速度和质量。

技术关键词

音频修改方法人声文本动作特征驱动特征视频时空特征时空特征信息视频特征向量时间偏移量关键点图片视频校准语音识别模型面部电子设备降噪模型音视频

系统为您推荐了相关专利信息

一种基于异构证据图的多模态对齐证据选择方法

异构节点表头表格表达式

一种区块链智能合约处理方法、装置、设备、存储介质及程序产品

智能合约代码自然语言区块链智能合约计算机执行指令索引

一种基于大数据的新媒体运营内容推荐系统及方法

内容推荐方法内容推荐系统媒体图像大数据

基于卷积神经网络的人体运动姿态数据采集系统

人体运动姿态多路径效应指数数据采集系统 GNSS数据

一种口部识别定位方法、装置及喂食机械臂

识别定位方法喂食机械臂 DS18B20温度传感器嵌入式处理器双目相机

视频内容修改方法、装置、电子设备及存储介质

站点导航

APP 下载