基于多尺度编解码器的多模态视频序列分割方法

正文

推荐专利

申请号：CN202510558541

申请日期：2025-04-29

公开号：CN120510545A

公开日期：2025-08-19

类型：发明专利

摘要

本发明公开了一种基于多尺度编解码器的多模态视频序列分割方法，步骤包括：提取图像特征和文本特征；获取同时包含图像与语言语义信息的联合特征表示；提取出在不同空间分辨率下的多尺度融合特征序列；得到时空建模后的特征表示序列；得到统一语义空间下的跨尺度融合特征表示；得到前景特征；对分割掩码进行视觉可视化生成语义分割图。该多模态视频序列分割方法能够实现图像和语言语义的深度交互，建立上下文和语义关系，通过多模态协同机制引入跨模态信息交互，增强模型在复杂动态场景中的鲁棒性与稳定性，有效提升图像序列分割模型在分割任务中的分割效果和泛化能力。

技术关键词

视频序列分割方法编解码器融合特征语义多尺度特征提取图像特征提取文本特征金字塔编码器多模态特征融合码头多模态协同多头注意力机制输出特征特征提取能力预训练模型

系统为您推荐了相关专利信息

一种电力负面清单数据的分类方法及系统

分布特征数据分布分类方法样本支持向量机模型

一种基于大语言模型协作的通信资源编排方法及系统

无线通信网络数据处理大语言模型智能通信网络资源编排方法通信网络资源

语义占据栅格预测方法、电子设备及存储介质

栅格匈牙利算法雨天图像参数卡尔曼滤波

一种抗扰动的三维物体语义分割几何增强方法

标量特征邻域三维计算机视觉技术特征值三维点云数据

一种基于人工智能的网络流量分析与管理系统

网络流量分析管理系统协议网络流量数据非结构化特征

基于多尺度编解码器的多模态视频序列分割方法

站点导航

APP 下载