摘要
本申请涉及计算机视觉和人工智能技术领域,尤其涉及一种文本生成粤剧视频的方法、装置、电子设备及介质。本申请通过从输入视频中计算出反转潜变量;将所述反转潜变量输入经过微调时间注意力层的所述关键帧生成模块,得到关键帧序列;所述关键帧序列包括运动信息;将所述关键帧序列输入所述时间插值模块,得到扩展帧序列;将所述扩展帧序列输入所述空间超分辨率模块,得到目标粤剧视频。这样,通过经过时间微调的文本生成视频扩散模型中的关键帧生成模块来实现定制化运动的视频生成,可以准确复现目标视频的运动,并且可以生成多样化的视觉变化。
技术关键词
关键帧
文本
运动向量
插值模块
超分辨率
序列
视频帧
噪声参数
注意力
机器可读指令
正态分布函数
电子设备
变量
处理器
可读存储介质
人工智能技术
系统为您推荐了相关专利信息
协作会话
情感识别模型
情感识别方法
在线协作
多模态
历史信息数据库
可视化界面
号码
存储设备
文本检测模型