摘要
本申请公开了一种视频生成方法、设备、存储介质及程序产品,涉及人工智能技术领域,包括:从当前第一视频中筛选出目标视频帧,并利用特征注入器输出第一特征向量;利用文生视频模型基于预设噪声和当前第一视频的描述文本生成第二特征向量,以生成相应的条件特征;确定当前第一视频的锚帧,根据锚帧和描述文本生成目标向量,进一步生成融合特征;基于融合特征生成新的当前第一视频,跳转至筛选目标视频帧的步骤,直至各第一视频的帧数和满足预设条件后,生成相应的第二视频。通过捕捉历史帧视觉特征,并且根据锚帧和描述文本确定融合特征,在未来视频帧生成过程中可以防止遗忘,解决了特征遗忘和时序不连续等问题,保持生成视频的一致性和平滑性。
技术关键词
视频生成方法
关键帧
视频帧
图像编码器
融合特征
重复视频
文本特征向量
图像特征向量
噪声
网络结构
构建训练集
文本编码器
可读存储介质
多模态
存储计算机程序
人工智能技术
多层感知机
系统为您推荐了相关专利信息
关节力矩
表面肌电信号
多分支
编码模块
多层感知机
深层特征提取
监测方法
特征提取模块
融合特征
监测模块
触觉传感器
钕铁硼磁性
触觉传感装置
序列
作用力