摘要
本公开关于一种文本输入生成动态三维视频的方法、装置、电子设备、计算机存储介质以及计算机程序产品,所述方法包括:获取文本数据,并基于文本数据生成满足文本数据的描述内容的参考视频;以文本数据和参考视频中的参考图片作为约束条件,生成满足文本数据描述和参考图片的静态三维模型;基于静态三维模型,确定动态信息生成模型;基于混合先验优化策略对动态信息生成模型优化监督,并基于优化监督后的动态信息生成模型,生成文本数据对应的三维视频;混合先验优化策略包括参考视频的直接先验和扩散模型的蒸馏先验。采用本方法,增强了三维视频的动态效果。
技术关键词
文本
视频
动态
三维模型
图片
多视角
蒸馏
数据
多分辨率
采样点
掩模
计算机程序产品
电子设备
网格
拓扑网络
相机
颜色
策略
系统为您推荐了相关专利信息
深度语义分析
构建用户画像
文本
大数据
随机森林模型
碰撞检测方法
畸形矫治
外固定器
平面位置关系
线段
二次设备
数据配置系统
上下文感知解析
校验模块
匹配模块