基于视频的三维场景构建方法、装置、设备及介质

正文

推荐专利

申请号：CN202510688561

申请日期：2025-05-26

公开号：CN120580358A

公开日期：2025-09-02

类型：发明专利

摘要

本发明涉及三维场景构建技术领域，可应用于金融科技和医疗健康领域，公开了一种基于视频的三维场景构建方法、装置、设备及介质，包括：通过对输入的原始视频按固定间隔采样提取关键视频帧，并提取所述关键视频帧的语义特征；对所述语义特征进行归一化处理得到归一语义特征，并将所述归一语义特征注入扩散模型的每一网络层；根据所述关键视频帧通过表面法线预测模型生成法线预测视频，其中，所述表面法线预测模型以所述扩散模型为基座，且插入了可增加所述法线预测视频连贯性的增强模块；根据所述法线预测视频及所述原始视频生成三维动态场景。实现了低成本且高效率地构建三维动态场景，不仅如此，还可输出高质量的三维动态场景。

技术关键词

三维场景构建方法语义特征三维动态场景视频帧三角网格模型三维场景构建技术三维场景构建装置光流估计算法交叉注意力机制序列深度图可读存储介质噪声特征医疗健康处理器贴图高效率地视频编码

系统为您推荐了相关专利信息

基于语义锚点的文本生成方法、装置、设备及介质

锚点语义文本生成方法视频帧序列

联合历史轨迹并基于语义匹配的目标跟踪方法、装置、电子设备和计算机可读存储介质

语义特征对象多尺度编码器跟踪方法

一种双阶段课堂教师教学行为检测方法、设备及介质

教师位置检测教学频率阶段视频

基于安全加密芯片的边缘物联代理方法

加密芯片序列物联编码向量非线性

基于声韵母语义编码的北斗短报文语音通信方法及系统

语音通信方法韵律特征参数拼音索引编码单元解码

基于视频的三维场景构建方法、装置、设备及介质

站点导航

APP 下载