摘要
本发明涉及人工智能、金融科技及数字医疗领域,公开了基于图像的视频生成方法、装置、设备及存储介质。所述方法包括:接收输入的静态图像并进行预处理,生成多尺度特征;基于多尺度特征,通过时空架构生成器的可微分搜索确定最优时空处理路径,生成融合了时序动态信息的输出特征;基于时序循环神经网络及输出特征生成视频帧;将视频帧输入视频帧序列,通过视频帧序列生成目标视频。本发明通过可微分搜索自动确定最优时空处理路径,摆脱人工干预,且通过动态生成融合时序信息的输出特征并生成视频,保证了视频的时序连贯性与细节真实性,提高了视频生成质量及效率,适用于金融、医疗领域的视频合成、内容创作、虚拟现实等高精度视频生成的应用。
技术关键词
时序循环神经网络
视频生成方法
视频帧
输出特征
多尺度特征
生成多尺度
融合时空信息
图像
信息熵
融合时序信息
序列
视频生成装置
动态
损失函数优化
可读存储介质
记忆
处理器
带通道
系统为您推荐了相关专利信息
无人机作业
无人机飞行路径
障碍物
变换器模块
多边形
输出特征
同步检测方法
YOLO模型
啤酒瓶
果实