一种基于视觉模型的目标导向视频语义通信系统

AITNT
正文
推荐专利
一种基于视觉模型的目标导向视频语义通信系统
申请号:CN202510981545
申请日期:2025-07-16
公开号:CN120529084B
公开日期:2025-10-28
类型:发明专利
摘要
本发明提供了一种基于视觉模型的目标导向视频语义通信系统,包括:语义提取器,基于SAM2模型,用于处理原始视频,生成分割掩码并提取语义信息;ViMamba编码器,用于对语义提取器的输出进行信道编码;信道适应模块,用于基于物理信道的信噪比信息优化编码序列ViMamba解码器,用于进行信道解码,得到特征序列;语义重建器,用于基于特征序列进行语义重建,恢复数据并输出目标视频。本发明解决了视频中冗余语义信息干扰大、深层语义编码能力不足以及在复杂信道环境下通信鲁棒性差的问题,在保障语义完整性的前提下,实现视频数据的高效压缩与鲁棒传输,大幅提升了语义通信的整体性能和适应性。
技术关键词
通信系统 图像编码器 信噪比信息 视频 采样模块 信道 语义特征 状态空间模型 视觉 解码器 序列 记忆 图像特征编码 发送端 图像块特征 多阶段
系统为您推荐了相关专利信息
1
基于深度学习的干渣机渣块视频识别检测方法及系统
融合特征 高层次 视频识别检测 特征提取模块 特征融合网络
2
基于多模态语料的网联汽车风险场景分析方法及相关设备
场景分析方法 多模态 生成测试报告 风险 计算机程序指令
3
一种基于双通道深度Q学习模型的智能化航迹起始方法
航迹起始方法 深度Q学习 优化神经网络模型 参数 雷达
4
一种基于场景语义理解的行为识别方法
场景语义理解 实体 动态场景 识别方法 空间关系特征
5
一种MIMO混合天线阵列及其设计与测量方法
混合天线阵列 微波天线 天线元件 信号传播路径 微波射频电路
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号