一种面向人机混合视觉的语义感知视频压缩方法及系统

正文

推荐专利

申请号：CN202511067894

申请日期：2025-07-31

公开号：CN120915949A

公开日期：2025-11-07

类型：发明专利

摘要

本发明涉及一种面向人机混合视觉的语义感知视频压缩方法及系统，方法包括：提取视频序列的动态语义，生成感兴趣区域；根据输入帧和对应的感兴趣区域掩码生成视觉一致的聚焦帧；通过熵模型预测聚焦帧的特征概率分布，并将其压缩为码流；通过条件解码器对码流进行解码，得到语义压缩重建视频；将基础分支和辅助分支的解码帧缓冲区中的解码帧进行特征对齐，生成预测特征；将预测特征的预测帧和视频序列输入熵模型中，通过熵编码压缩为码流；对码流进行解码得到重建特征；将重建特征转化为精细重建特征，得到最终的压缩重建视频。与现有技术相比，本发明在低码率条件下仍能维持较高的机器视觉任务准确度，在机器视觉任务中实现更高的率准确率性能。

技术关键词

感知视频压缩方法面向人机生成感兴趣区域语义预测特征视觉序列特征分支交叉注意力机制聚焦特征解码器比特数视频压缩系统网络编码

系统为您推荐了相关专利信息

VR航天器拼装的动态调整方法、系统、设备和存储介质

模组航天器动态交互设备模式

基于深度神经模型的网络恶意攻击监测方法及系统

DGA域名恶意程序代码网络安全模块网络安全知识图谱神经网络模型

对象信息的获取方法、设备、存储介质及程序产品

地图数据库对象标识语义向量信息更新

一种基于人工智能的疾病科普纠错方法及系统

焦点动态权重分配跨模态图谱纠错方法

一种复杂地形下的无人机集群拓扑动态优化方法及系统

分布式强化学习三维建模数据中继节点通信链路状态集群通信

一种面向人机混合视觉的语义感知视频压缩方法及系统

站点导航

APP 下载