深度学习驱动的视频压缩与高保真重建系统

正文

推荐专利

深度学习驱动的视频压缩与高保真重建系统

申请号：CN202510403633

申请日期：2025-04-01

公开号：CN120602680A

公开日期：2025-09-05

类型：发明专利

摘要

本发明公开了深度学习驱动的视频压缩与高保真重建系统，属于视频压缩与重建技术领域，深度学习驱动的视频压缩与高保真重建系统包括以下步骤：S1.双路径架构含空间和时间编码器及融合模块；S2.结构化模板解析文本生成空间/运动嵌入向量，空间路径执行视觉－文本交叉注意力，时间路径用5步长一维卷积生成sigmoid门控系数加权融合运动特征与视觉特征；S3.训练初期KL散度与重建损失动态加权，中后期引入多层级监督，学习率周期性衰减至下限1e‑5，验证指标停滞则早停；S4特征拼接后经可变形卷积跨模态融合，亚像素上采样八倍重建；有益效果包括在低码率下仍能保持高保真度和时间流畅性，适用于超高清视频、AR/VR场景。

技术关键词

重建系统视频压缩 sigmoid函数视觉特征解码器编码器峰值信噪比分辨率文本融合运动特征变形卷积网络跨模态交叉注意力机制上采样语义特征像素周期

系统为您推荐了相关专利信息

一种基于多任务预训练微调范式的交通流数据插补与预测方法

交通流预测训练混合模型多任务数据模式

基于图像分割模型的胎儿超声图像分割方法、系统及产品

胎儿超声图像图像分割模型分割方法微调特征子模块

一种基于改进UNet模型的烟叶叶脉分割方法及装置

分割方法图像烟叶样品编码器烟叶品质评价

资产巡检方法、装置、计算机设备和存储介质

三维语义分割巡检机器人多模态融合语义语义向量

一种基于可解释性与模型融合的风电功率预测方法及装置

电功率预测方法前馈神经网络风电功率预测模型多头注意力机制编码器

深度学习驱动的视频压缩与高保真重建系统

站点导航

APP 下载