口播视频生成方法、装置、设备及存储介质

AITNT
正文
推荐专利
口播视频生成方法、装置、设备及存储介质
申请号:CN202510007175
申请日期:2025-01-02
公开号:CN119835491A
公开日期:2025-04-15
类型:发明专利
摘要
本申请公开了一种口播视频生成方法、装置、设备及存储介质,涉及计算机技术领域,公开的方法包括:接收口播音频样本以及当前文本内容;通过初始人物模型对口播音频样本进行学习,以生成与口播音频样本的音色对应的目标人物模型;通过目标人物模型基于当前文本内容生成口播视频。由于本申请通过利用初始人物模型对口播音频样本进行学习的方式来生成与口播音频样本的音色对应的目标人物模型,因此,相较于现有技术基于文本只能生成默认风格音色的口播视频,本申请通过口播音频样本能够实现对对初始人物模型的音色进行调整,从而能够满足用户需求,有效提高了用户使用体验。
技术关键词
人物模型 视频生成方法 音色特征 音频 样本 文本 人物特征 视频生成设备 视频生成装置 数据接收模块 处理器 可读存储介质 指令 存储器 风格 参数 计算机
系统为您推荐了相关专利信息
1
一种基于ViT3D模型改进的脑龄评估及可视化方法与系统
可视化方法 样本 矩阵 多层注意力 模块
2
一种基于环境归趋的流域抗生素生态风险防控策略模拟方法
风险防控策略 抗生素 逸度模型 生态风险评价 参数
3
一种基于聚类下采样和可解释深度森林的脑卒中预测方法
深度森林模型 数据 训练集 指标 级联
4
基于学术文献的语义关联分析方法及系统
关联分析方法 文本 文献管理系统 概念 术语
5
多任务联合训练方法、装置、计算机设备、可读存储介质和程序产品
联合训练方法 样本 数据 图像 多任务联合训练
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号