文本输入生成动态三维视频的方法、装置、电子设备及存储介质

正文

推荐专利

申请号：CN202410756606

申请日期：2024-06-12

公开号：CN118741069A

公开日期：2024-10-01

类型：发明专利

摘要

本公开关于一种文本输入生成动态三维视频的方法、装置、电子设备、计算机存储介质以及计算机程序产品，所述方法包括：获取文本数据，并基于文本数据生成满足文本数据的描述内容的参考视频；以文本数据和参考视频中的参考图片作为约束条件，生成满足文本数据描述和参考图片的静态三维模型；基于静态三维模型，确定动态信息生成模型；基于混合先验优化策略对动态信息生成模型优化监督，并基于优化监督后的动态信息生成模型，生成文本数据对应的三维视频；混合先验优化策略包括参考视频的直接先验和扩散模型的蒸馏先验。采用本方法，增强了三维视频的动态效果。

技术关键词

文本视频动态三维模型图片多视角蒸馏数据多分辨率采样点掩模计算机程序产品电子设备网格拓扑网络相机颜色策略

系统为您推荐了相关专利信息

基于大数据智能挖掘的新闻资讯发布平台

深度语义分析构建用户画像文本大数据随机森林模型

一种用于足踝骨畸形矫治的骨截面-骨截面碰撞检测方法

碰撞检测方法畸形矫治外固定器平面位置关系线段

自动驾驶算法的仿真测试方法、装置、计算机设备和介质

测试场景行驶车辆仿真测试方法动态算法

多模态场景自适应提示的开放词汇目标检测方法及装置

多模态场景视觉特征低秩分解方法文本

一种电气监控用数据配置系统

二次设备数据配置系统上下文感知解析校验模块匹配模块

文本输入生成动态三维视频的方法、装置、电子设备及存储介质

站点导航

APP 下载