多模态融合的实时视频超分辨率重建方法及其系统

正文

推荐专利

申请号：CN202510383211

申请日期：2025-03-28

公开号：CN119887530B

公开日期：2025-07-22

类型：发明专利

摘要

本发明涉及计算机视觉和深度学习技术领域，具体涉及多模态融合的实时视频超分辨率重建方法及其系统，包括以下步骤：获取低分辨率视频序列；采用CLIP模型提取视觉特征和文本特征，并进行双模态特征融合，生成指导特征；通过多模态融合模块对所述指导特征与所述低分辨率视频进行特征对齐；采用轻量化残差模块提取高质量特征；通过帧间信息流传播融合多帧特征，并采用自适应卡尔曼滤波进行运动补偿；将所述高质量特征与特征融合后的信息结合重建高清图像，通过引入CLIP模型提取视觉和文本特征，实现了多模态信息的融合，增强了语义理解能力，提高了超分辨率重建的质量和细节表现。

技术关键词

超分辨率重建方法实时视频视觉特征卡尔曼滤波残差模块多模态特征学习网络运动补偿模块双模态文本序列深度学习技术多尺度高清重建系统特征提取模块多层感知机

多模态融合的实时视频超分辨率重建方法及其系统

站点导航

APP 下载