摘要
本发明涉及视频生成领域,公开了一种视频生成方法、装置、设备及介质,包括:对原始视频数据进行处理,得到若干个初始帧图像;将每个初始帧图像均分割重塑为二维图块序列并进行嵌入处理,生成图块嵌入序列;将图块嵌入序列输入到具有测试时学习层的视频生成模型中,隐藏状态为卷积神经网络;对图块嵌入序列进行多头注意力机制的处理,得到多头注意力机制的输出结果;对多头注意力机制的输出结果进行特征提取和残差连接,根据残差连接的输出结果生成图像表示;对图像表示进行解码生成新的图像帧,将所有新的图像帧进行拼接后得到目标视频。实现了从输入视频到新视频内容的高质量转换,能够捕捉视频中的复杂时空关系,生成连贯且逼真的视频内容。
技术关键词
多头注意力机制
视频生成方法
序列
非易失性计算机可读存储介质
视频生成模型
计算机可执行指令
视频生成装置
线性变换矩阵
数据
特征值
分辨率
解码
处理器通信
图像分割
样本
计算机设备
系统为您推荐了相关专利信息
库存管理方法
库存周转率
建立预测模型
需求预测模型
数据
时间序列预测模型
人工智能优化方法
合规性
人工智能优化系统
粒子群优化算法
超高压水射流清洗
设备状态监测
数据传输模块
ARIMA模型
人机交互模块