一种数字人的口播视频生成方法、系统、设备及介质

正文

推荐专利

申请号：CN202510800917

申请日期：2025-06-16

公开号：CN120475233A

公开日期：2025-08-12

类型：发明专利

摘要

本申请公开了一种数字人的口播视频生成方法、系统、设备及介质，方法通过获取口播文案和视频素材数据，利用多模态大模型分析确定文案在视频素材中的时间戳；将文案转为音频数据并预处理后，结合时间戳与视频合并生成第一视频数据；根据用户需求生成数字人，经抠像处理后与第一视频合并得到口播视频。本申请突破传统模板化生成模式，通过多模态语义匹配和个性化数字人生成技术，实现数字人口播视频的定制化生产；同时采用音视频精准同步、高质量抠像及合成技术，保障内容适配性与视频质量，显著提升数字人口播视频生产的灵活性、效率和效果。

技术关键词

视频生成方法视频素材数据生成数字人视频生成系统细化算法音频图像处理技术多模态计算机电子设备轮廓边缘相位声码器透明度可读存储介质语音模块生成技术处理器

一种数字人的口播视频生成方法、系统、设备及介质

站点导航

APP 下载