口播视频生成方法、装置、设备及存储介质

正文

推荐专利

口播视频生成方法、装置、设备及存储介质

申请号：CN202510007175

申请日期：2025-01-02

公开号：CN119835491A

公开日期：2025-04-15

类型：发明专利

摘要

本申请公开了一种口播视频生成方法、装置、设备及存储介质，涉及计算机技术领域，公开的方法包括：接收口播音频样本以及当前文本内容；通过初始人物模型对口播音频样本进行学习，以生成与口播音频样本的音色对应的目标人物模型；通过目标人物模型基于当前文本内容生成口播视频。由于本申请通过利用初始人物模型对口播音频样本进行学习的方式来生成与口播音频样本的音色对应的目标人物模型，因此，相较于现有技术基于文本只能生成默认风格音色的口播视频，本申请通过口播音频样本能够实现对对初始人物模型的音色进行调整，从而能够满足用户需求，有效提高了用户使用体验。

技术关键词

人物模型视频生成方法音色特征音频样本文本人物特征视频生成设备视频生成装置数据接收模块处理器可读存储介质指令存储器风格参数计算机

系统为您推荐了相关专利信息

一种基于ViT3D模型改进的脑龄评估及可视化方法与系统

可视化方法样本矩阵多层注意力模块

一种基于环境归趋的流域抗生素生态风险防控策略模拟方法

风险防控策略抗生素逸度模型生态风险评价参数

一种基于聚类下采样和可解释深度森林的脑卒中预测方法

深度森林模型数据训练集指标级联

基于学术文献的语义关联分析方法及系统

关联分析方法文本文献管理系统概念术语

多任务联合训练方法、装置、计算机设备、可读存储介质和程序产品

联合训练方法样本数据图像多任务联合训练

口播视频生成方法、装置、设备及存储介质

站点导航

APP 下载