一种基于时序交叉注意力机制的视频语义分割方法

正文

推荐专利

申请号：CN202510912693

申请日期：2025-07-03

公开号：CN120411866B

公开日期：2025-11-04

类型：发明专利

摘要

本发明公开了一种基于时序交叉注意力机制的视频语义分割方法，属于计算机视觉领域和材料检测领域，本发明首先对用于训练的视频预处理并提取帧序列，接着构建多层级特征提取与融合的编码‑解码网络，通过时序交叉注意力模块增强特征提取，通过加权IoU损失和二进制交叉熵BCE损失优化网络参数，然后用训练的模型对目标视频逐帧预测分割，并导出多分类分割结果。本发明将时序交叉注意力机制融入SAMUNet网络中，针对具有时序的图像数据有效提升了分割精度，极大降低了材料视频处理的时间成本和人力成本，可广泛应用于工业检测领域，提高产品质量和生产效率。

技术关键词

视频语义分割方法交叉注意力机制转换器模块时序图像解码器图像编码器语义分割模型训练掩膜统计分析模型关键帧加权损失函数适配器优化网络参数

系统为您推荐了相关专利信息

一种增强数据驱动的建筑碳排集成预测系统及方法

集成预测方法残差模型建筑特征提取模块预测系统

基于数据与物理模型的作业场所粉尘浓度预测系统及方法

监测作业作业场所监测单元数据传输模块温湿度

跨领域协同的信息追踪定位辅助方法及系统

定位辅助方法主题分布特征语义特征时序资源标识符

迟滞特性正逆向模型建模方法、系统、设备及存储介质

模型建模方法高斯混合模型协方差矩阵时序压电微动平台

一种基于机器学习的矿山井巷测量方法及系统

矿山井巷网格三维点云数据测量方法循环神经网络算法

一种基于时序交叉注意力机制的视频语义分割方法

站点导航

APP 下载