摘要
本发明公开一种文本引导的图像分割方法,包括:在图像分支中,对采集到的图像,通过N个编码器块组成的视觉骨干编码器进行处理,生成N个不同尺度的图像标记;在文本分支中,文本描述通过文本骨干编码器进行标记化获得文本标记;将图像标记和文本标记共同输入至非对称双边提示块中;在非对称双边提示块中,将图像和文本信息进行融合和交互;在解码阶段,利用一个由N个文本引导的解码块和一个最终的解码块组成的图像解码器,在文本信息的帮助下对图像标记进行上采样;输出通过分割头传递,从而获得感染区域的图像分割结果。本发明能够克服当前方法的主要局限性,即缺乏对文本标记的自适应调整和文本先验信息的充分利用。
技术关键词
图像分割方法
文本
标记
分支
编码器
图像解码器
上采样
注意力
投影器
译码器
投影仪
视觉
阶段
级联
通道
元素
系统为您推荐了相关专利信息
惯性传感器
无人艇
ORB特征
定位方法
侧扫声呐图像
数字孪生模型
评判方法
智能分析模型
区块链存证技术
物理
语言模型训练方法
大语言模型
度量
标签文本
问答模型