一种文本生成粤剧视频的方法、装置、电子设备及介质

AITNT
正文
推荐专利
一种文本生成粤剧视频的方法、装置、电子设备及介质
申请号:CN202411065751
申请日期:2024-08-05
公开号:CN119211637B
公开日期:2025-10-03
类型:发明专利
摘要
本申请涉及计算机视觉和人工智能技术领域,尤其涉及一种文本生成粤剧视频的方法、装置、电子设备及介质。本申请通过从输入视频中计算出反转潜变量;将所述反转潜变量输入经过微调时间注意力层的所述关键帧生成模块,得到关键帧序列;所述关键帧序列包括运动信息;将所述关键帧序列输入所述时间插值模块,得到扩展帧序列;将所述扩展帧序列输入所述空间超分辨率模块,得到目标粤剧视频。这样,通过经过时间微调的文本生成视频扩散模型中的关键帧生成模块来实现定制化运动的视频生成,可以准确复现目标视频的运动,并且可以生成多样化的视觉变化。
技术关键词
关键帧 文本 运动向量 插值模块 超分辨率 序列 视频帧 噪声参数 注意力 机器可读指令 正态分布函数 电子设备 变量 处理器 可读存储介质 人工智能技术
系统为您推荐了相关专利信息
1
基于大语言模型时空推理的复杂制造系统生产排程引擎
编码向量 大语言模型 内核 语义特征 编码特征
2
协作会话情感识别方法、装置、电子设备及存储介质
协作会话 情感识别模型 情感识别方法 在线协作 多模态
3
面向电子设备加热的仿真模拟报告标注方法及系统
报告 样本 数据 决策 加热
4
行业资讯图生成方法、电子设备、存储介质与产品
生成方法 热点 文本生成模型 板块 层级
5
一种基于票据代码号码的连号情况校验的方法、装置
历史信息数据库 可视化界面 号码 存储设备 文本检测模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号