一种基于混合模型的指向性图像分割方法及系统

正文

推荐专利

申请号：CN202510701029

申请日期：2025-05-28

公开号：CN120563842B

公开日期：2025-12-02

类型：发明专利

摘要

本发明提出了一种基于混合模型的指向性图像分割方法及系统，属于计算机视觉技术领域，包括：获取图像及文本描述数据集；构建双分支视觉‑语言编码架构对图像进行编码提取若干不同尺度的视觉特征，并同时对文本描述进行编码，提取文本特征；采用多尺度跨模态注意力模块对同一尺度的视觉特征和文本特征进行跨模态融合，生成多模态特征；对各个尺度的多模态特征分别采用分层特征融合模块进行融合得到第一融合特征；采用跨层级信息整合模块进行层间特征的融合得到最终融合特征；采用分割模块对最终融合特征进行预测得到分割后的图像。本发明结合CNN和Transformer架构的优势，以提升指向性图像分割任务的精度和泛化能力。

技术关键词

图像分割方法融合特征视觉特征多模态特征跨模态文本分层特征多尺度分支注意力机制编码融合策略模块图像分割系统表达式计算机视觉技术层级

系统为您推荐了相关专利信息

一种多注意力引导的医学图像分割方法

医学图像分割模型医学图像分割方法注意力解码器梯度下降优化算法

一种基于跨模态大模型的末端空调调控方法

空调调控方法跨模态文本适配器技术设备健康管理

面向特定领域多模态神经机器翻译的两阶段语义聚合方法

机器翻译语义阶段图文多层次

一种基于时空动态网络的交通预警方法及装置

交通预警方法多源交通数据依赖特征语义特征交通预警装置

一种基于文字-3D图像的多模态脑卒中预测方法

图像特征编码 BERT模型自然语言样本跨模态

一种基于混合模型的指向性图像分割方法及系统

站点导航

APP 下载