文本输入生成动态三维视频的方法、装置、电子设备及存储介质

AITNT
正文
推荐专利
文本输入生成动态三维视频的方法、装置、电子设备及存储介质
申请号:CN202410756606
申请日期:2024-06-12
公开号:CN118741069A
公开日期:2024-10-01
类型:发明专利
摘要
本公开关于一种文本输入生成动态三维视频的方法、装置、电子设备、计算机存储介质以及计算机程序产品,所述方法包括:获取文本数据,并基于文本数据生成满足文本数据的描述内容的参考视频;以文本数据和参考视频中的参考图片作为约束条件,生成满足文本数据描述和参考图片的静态三维模型;基于静态三维模型,确定动态信息生成模型;基于混合先验优化策略对动态信息生成模型优化监督,并基于优化监督后的动态信息生成模型,生成文本数据对应的三维视频;混合先验优化策略包括参考视频的直接先验和扩散模型的蒸馏先验。采用本方法,增强了三维视频的动态效果。
技术关键词
文本 视频 动态 三维模型 图片 多视角 蒸馏 数据 多分辨率 采样点 掩模 计算机程序产品 电子设备 网格 拓扑网络 相机 颜色 策略
系统为您推荐了相关专利信息
1
基于大数据智能挖掘的新闻资讯发布平台
深度语义分析 构建用户画像 文本 大数据 随机森林模型
2
一种用于足踝骨畸形矫治的骨截面-骨截面碰撞检测方法
碰撞检测方法 畸形矫治 外固定器 平面位置关系 线段
3
自动驾驶算法的仿真测试方法、装置、计算机设备和介质
测试场景 行驶车辆 仿真测试方法 动态 算法
4
多模态场景自适应提示的开放词汇目标检测方法及装置
多模态 场景 视觉特征 低秩分解方法 文本
5
一种电气监控用数据配置系统
二次设备 数据配置系统 上下文感知解析 校验模块 匹配模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号