摘要
本申请提出一种视频生成方法、视频生成装置、视频生成设备以及计算机存储介质。所述视频生成方法包括:获取若干模态的输入数据;提取每一种模态输入数据的单模态特征;将若干单模态特征映射到同一维度的潜在表示空间,获取若干潜在模态特征;将所述若干潜在模态特征融合,得到融合模态特征;利用所述融合模态特征,生成目标视频。通过上述视频生成方法,利用映射到同一维度的潜在表示空间将多模态特征实现统一处理,在多模态输入之间建立有效的融合机制,提高多模态信息之间的高效互补和联合表征,有利于生成目标视频的准确性。
技术关键词
模态特征
视频生成方法
时间序列信息
视频生成装置
视频生成设备
计算机存储介质
时序特征
分辨率提升
视频帧特征
输入模块
数据
多模态信息
超分辨率
注意力机制
存储器
程序
跨模态
系统为您推荐了相关专利信息
心血管疾病检测
视网膜眼底图像
特征提取模块
血管分割
图像综合特征
三维点云数据
多模态
融合特征
特征提取网络
模态特征
感知优化方法
激光雷达点云数据
语义分割网络
语义特征
图像结构信息
人格预测方法
量子优化算法
数据
图像特征向量
文本