视频生成模型的训练方法、装置、设备、存储介质、程序产品及视频生成方法

AITNT
正文
推荐专利
视频生成模型的训练方法、装置、设备、存储介质、程序产品及视频生成方法
申请号:CN202510829074
申请日期:2025-06-19
公开号:CN120614502A
公开日期:2025-09-09
类型:发明专利
摘要
本申请提供了一种视频生成模型的训练方法、装置、设备、存储介质、程序产品及视频生成方法;包括:获取第一样本数据集;第一样本数据集包括第一驱动音频、第一对象的第一真值视频以及第一掩码视频;第一掩码视频是对第一真值视频中第一对象的脸部部分区域进行掩码后得到的视频;通过待训练的视频生成模型,基于第一驱动音频,对第一真值视频和第一掩码视频进行语音驱动,得到第一驱动视频;基于第一驱动音频、第一驱动视频和第一真值视频进行判别损失计算,得到视频生成模型的判别损失结果;基于判别损失结果,对视频生成模型的模型参数进行更新,得到训练后的视频生成模型。通过本申请,能够提升视频生成模型的视频生成效果。
技术关键词
视频生成模型 视频生成方法 计算机可执行指令 图像 视觉特征提取 语义特征提取 语音 对象 计算机程序产品 音频特征 样本 可读存储介质 解码模块 编码模块
系统为您推荐了相关专利信息
1
支持多模态输入的移动端边缘智能推理方法及系统
识别区 元素 识别视频数据 声波 智能推理方法
2
一种基于行业大模型的野火检测方法、装置、设备及介质
野火检测 转换后图像 双向注意力机制 图像特征数据 切片
3
一种高空作业安全带佩戴检测的方法及系统
高空作业安全带 注意力 非线性神经网络 输入检测系统 图片
4
一种多模态特征数据融合的小麦氮素处方图自动生成方法
多模态特征 自动生成方法 归一化植被指数 多尺度特征金字塔 分支
5
基于小角X射线散射设备的自适应束斑校准方法及系统
小角X射线散射 校准方法 探测器 滤波片 蒙特卡洛
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号