一种基于视觉模型的目标导向视频语义通信系统

正文

推荐专利

申请号：CN202510981545

申请日期：2025-07-16

公开号：CN120529084B

公开日期：2025-10-28

类型：发明专利

摘要

本发明提供了一种基于视觉模型的目标导向视频语义通信系统，包括：语义提取器，基于SAM2模型，用于处理原始视频，生成分割掩码并提取语义信息；ViMamba编码器，用于对语义提取器的输出进行信道编码；信道适应模块，用于基于物理信道的信噪比信息优化编码序列ViMamba解码器，用于进行信道解码，得到特征序列；语义重建器，用于基于特征序列进行语义重建，恢复数据并输出目标视频。本发明解决了视频中冗余语义信息干扰大、深层语义编码能力不足以及在复杂信道环境下通信鲁棒性差的问题，在保障语义完整性的前提下，实现视频数据的高效压缩与鲁棒传输，大幅提升了语义通信的整体性能和适应性。

技术关键词

通信系统图像编码器信噪比信息视频采样模块信道语义特征状态空间模型视觉解码器序列记忆图像特征编码发送端图像块特征多阶段

系统为您推荐了相关专利信息

基于深度学习的干渣机渣块视频识别检测方法及系统

融合特征高层次视频识别检测特征提取模块特征融合网络

基于多模态语料的网联汽车风险场景分析方法及相关设备

场景分析方法多模态生成测试报告风险计算机程序指令

一种基于双通道深度Q学习模型的智能化航迹起始方法

航迹起始方法深度Q学习优化神经网络模型参数雷达

一种基于场景语义理解的行为识别方法

场景语义理解实体动态场景识别方法空间关系特征

一种MIMO混合天线阵列及其设计与测量方法

混合天线阵列微波天线天线元件信号传播路径微波射频电路

一种基于视觉模型的目标导向视频语义通信系统

站点导航

APP 下载