摘要
本发明提供一种基于实例感知查询的鲁棒多模态图像分割方法和系统,方法包括:获取原始图像数据和文本描述数据,通过语义解析和因果图构建生成训练数据;采用多层编码网络提取图像特征和文本特征,通过因果推理建立特征依赖关系;基于注意力计算生成实例聚类特征,结合多尺度融合策略得到融合特征;计算查询置信度并生成候选分割掩码,经过后处理优化输出最终分割结果。本发明通过引入因果推理和实例感知查询机制,提高了跨模态特征对齐精度和分割结果的鲁棒性,在复杂场景下具有更好的分割性能和泛化能力。
技术关键词
图像分割方法
文本
聚类特征
原始图像数据
融合特征
节点
语义
实体
视觉特征
多尺度特征
生成特征
密集特征
注意力
跨尺度特征融合
查询特征
加权特征
区域分割算法
模态特征
系统为您推荐了相关专利信息
影像
融合分类方法
多尺度特征融合
非线性
训练集
数据分析模型
分析医疗数据
医疗数据分析方法
标签
计算机设备