视频生成方法、模型训练方法、装置及计算机程序产品

AITNT
正文
推荐专利
视频生成方法、模型训练方法、装置及计算机程序产品
申请号:CN202510538730
申请日期:2025-04-27
公开号:CN120658921A
公开日期:2025-09-16
类型:发明专利
摘要
本申请公开了一种视频生成方法、模型训练方法、装置及计算机程序产品,视频生成方法包括:获取用于生成视频的目标音频以及参考图片,参考图片中包括发声对象;根据目标音频对应的一个或多个音频片段的片段特征以及参考图像,确定音频片段对应的各待生成视频帧的全局视觉特征;根据目标音频各音频帧的发音特征以及参考图片中发声对象的唇部特征,确定音频帧对应的待生成视频帧中发声对象的唇部特征;根据待生成视频帧对应的唇部特征和全局视觉特征,生成各视频帧。通过本申请提供的方案既能够使得所生成的视频中人物的表达更加生动自然,也能够很准确地使得唇部动作和音频同步,提高用户的视觉体验。
技术关键词
全局视觉特征 唇部特征 音频 视频生成方法 发声 发音特征 视频帧 视频生成模型 对象 图片 样本 计算机程序产品 模型训练方法 图像 脸部特征 视频生成装置 关键点 基础
系统为您推荐了相关专利信息
1
一种服装定制化订单的处理方法及系统
订单 协议 物料需求量 语音特征数据 终端
2
一种基于言语和生理特征对对话情绪进行实时分析的系统
音频采集模块 生理 情绪识别模型 情绪特征 光学检测器
3
一种电子节目指南生成方法、装置、设备和介质
节目特征 偏好特征 生成电子节目指南 兴趣 文本分析模型
4
基于WebAssembly的电动车动态功能更新系统
功能更新系统 MQTT协议 动态 车载传感器 音频系统控制
5
适用于复杂环境下的音频数据增强方法及系统
序列 语音 音频数据处理技术 频段 噪声
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号