一种数字人的口播视频生成方法、系统、设备及介质

AITNT
正文
推荐专利
一种数字人的口播视频生成方法、系统、设备及介质
申请号:CN202510800917
申请日期:2025-06-16
公开号:CN120475233A
公开日期:2025-08-12
类型:发明专利
摘要
本申请公开了一种数字人的口播视频生成方法、系统、设备及介质,方法通过获取口播文案和视频素材数据,利用多模态大模型分析确定文案在视频素材中的时间戳;将文案转为音频数据并预处理后,结合时间戳与视频合并生成第一视频数据;根据用户需求生成数字人,经抠像处理后与第一视频合并得到口播视频。本申请突破传统模板化生成模式,通过多模态语义匹配和个性化数字人生成技术,实现数字人口播视频的定制化生产;同时采用音视频精准同步、高质量抠像及合成技术,保障内容适配性与视频质量,显著提升数字人口播视频生产的灵活性、效率和效果。
技术关键词
视频生成方法 视频素材数据 生成数字人 视频生成系统 细化算法 音频 图像处理技术 多模态 计算机电子设备 轮廓边缘 相位声码器 透明度 可读存储介质 语音 模块 生成技术 处理器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号