视频生成方法和视频生成装置、电子设备、存储介质

AITNT
正文
推荐专利
视频生成方法和视频生成装置、电子设备、存储介质
申请号:CN202511071622
申请日期:2025-07-30
公开号:CN120916028A
公开日期:2025-11-07
类型:发明专利
摘要
本申请实施例提供了一种视频生成方法和视频生成装置、电子设备、存储介质,涉及人工智能领域,应用于金融科技和医疗领域。该方法包括:获取视频生成场景对应的目标图像和视频配置数据,并对目标图像进行深度估计得到目标深度图;根据目标深度图和目标图像提取多尺度深度特征;根据视频配置数据和目标图像进行视频时序预测,得到时序预测特征;获取预设动态记忆库,预设动态记忆库包含与视频生成场景匹配的场景代表特征;根据场景代表特征、多尺度深度特征和时序预测特征进行特征融合,得到目标融合特征;对目标融合特征进行解码得到多个预测视频帧,并根据多个预测视频帧生成目标合成视频。本申请实施例能够提高生成视频的连贯性和自然度。
技术关键词
预测特征 多尺度特征提取 视频生成模型 融合特征 生成场景 时序 样本 视频帧深度图 视频生成装置 视频生成方法 图像 注意力 记忆 偏移特征 代表
系统为您推荐了相关专利信息
1
第三方服务访问方法、装置、设备及存储介质
服务访问方法 分数预测模型 注意力模型 客户端 访问第三方服务
2
一种变压器有载分接开关多通道振动信号融合特征提取方法
融合特征提取 多通道 有载分接开关 Lyapunov指数 信号
3
基于多尺度特征与关联特征的中文短文本分类方法及系统
多尺度语义特征 文本分类器 词语 多尺度特征 BERT模型
4
一种基于自然语言理解的多模态大语言模型对话生成方法
对话生成方法 自然语言理解 大语言模型 多模态信息 融合特征
5
一种多模态大模型的全自动标注方法及系统
多模态特征融合 标注方法 图片 融合特征 模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号