摘要
本发明提供了一种基于视觉模型的目标导向视频语义通信系统,包括:语义提取器,基于SAM2模型,用于处理原始视频,生成分割掩码并提取语义信息;ViMamba编码器,用于对语义提取器的输出进行信道编码;信道适应模块,用于基于物理信道的信噪比信息优化编码序列ViMamba解码器,用于进行信道解码,得到特征序列;语义重建器,用于基于特征序列进行语义重建,恢复数据并输出目标视频。本发明解决了视频中冗余语义信息干扰大、深层语义编码能力不足以及在复杂信道环境下通信鲁棒性差的问题,在保障语义完整性的前提下,实现视频数据的高效压缩与鲁棒传输,大幅提升了语义通信的整体性能和适应性。
技术关键词
通信系统
图像编码器
信噪比信息
视频
采样模块
信道
语义特征
状态空间模型
视觉
解码器
序列
记忆
图像特征编码
发送端
图像块特征
多阶段
系统为您推荐了相关专利信息
融合特征
高层次
视频识别检测
特征提取模块
特征融合网络
场景分析方法
多模态
生成测试报告
风险
计算机程序指令
航迹起始方法
深度Q学习
优化神经网络模型
参数
雷达
场景语义理解
实体
动态场景
识别方法
空间关系特征
混合天线阵列
微波天线
天线元件
信号传播路径
微波射频电路