摘要
本发明公开了一种基于不确定性估计的多模态状态空间集成的图像分割方法,该方法包括:获取图像数据和图像数据对应的文本数据;利用CLV‑SSIF模型,根据图像数据和文本数据,对图像进行分割,其中,CLV‑SSIF模型包含多模态空间集成组件和多专家不确定性优化组件,多模态空间集成组件包括图像编码器、文本编码器以及多模态交互式引导解码器;多专家不确定性优化组件用于利用多专家混合模型,生成对图像的初始分割结果并生成专家不确定估计,然后根据专家不确定估计,对初始分割结果进行优化。本发明的方法提升了图像分割的准确度。
技术关键词
图像分割方法
图像编码器
集成组件
多模态特征
掩膜
文本编码器
多模态交互
解码器
模块
生成图像特征
交叉注意力机制
数据
上采样
适配器
系统为您推荐了相关专利信息
读数识别方法
指针仪表
多尺度
特征提取单元
图像
多算法融合模型
回复系统
分发模块
关联算法
分配器
焊接设备控制方法
图像生成模型
图像编码器
样本
焊接设备控制系统