视频生成模型训练方法、视频生成方法、装置及电子设备

AITNT
正文
推荐专利
视频生成模型训练方法、视频生成方法、装置及电子设备
申请号:CN202411116935
申请日期:2024-08-14
公开号:CN119135986A
公开日期:2024-12-13
类型:发明专利
摘要
本公开提出一种视频生成模型的训练方法、视频生成方法、装置及电子设备,其中,该训练方法包括:对参考图像进行特征提取,得到第一多模态特征信息;对驱动视频进行特征提取,得到第二多模态特征信息;根据第一多模态特征信息和第二多模态特征信息生成控制条件特征信息;根据参考图像和驱动视频生成原始噪声,并对参考图像进行编码处理,得到参考图像的嵌入向量;根据控制条件特征信息、原始噪声和参考图像的嵌入向量进行噪声预测,得到符合控制条件特征信息的预测噪声;根据原始噪声和预测噪声的差异,对视频生成模型的参数进行调整,得到训练后的视频生成模型。由此,通过利用多模态条件控制信息,更能确保生成动作的稳定性。
技术关键词
视频生成模型 多模态特征 深度特征信息 噪声预测 融合特征 编码特征 骨骼特征 编码器 注意力 图像 视频生成方法 动作特征 适配器 生成特征 运动控制模块 特征提取器
系统为您推荐了相关专利信息
1
一种基于事件引导的生成式视频扩散模型的视频插帧方法
视频插帧方法 多模态特征融合 残差学习 嵌入特征 事件流数据
2
一种基于驾驶员视觉特征融合的危险行为预警方法
融合特征 视觉特征 预警方法 多模态 数据
3
一种基于卷积神经网络的高频磁环电感动态阻抗校准方法
阻抗校准方法 高频磁环 动态 融合特征 双向注意力机制
4
融合多尺度特征增强的YOLOv11爆破现场火工品实时检测方法
融合多尺度特征 实时检测方法 网络 模块 实时图像
5
一种基于证据回归的多智能体协同感知系统及方法
协同感知方法 协同感知系统 点云特征 卷积神经网络提取 融合特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号