一种文本引导的图像分割方法

AITNT
正文
推荐专利
一种文本引导的图像分割方法
申请号:CN202410853324
申请日期:2024-06-28
公开号:CN118628746A
公开日期:2024-09-10
类型:发明专利
摘要
本发明公开一种文本引导的图像分割方法,包括:在图像分支中,对采集到的图像,通过N个编码器块组成的视觉骨干编码器进行处理,生成N个不同尺度的图像标记;在文本分支中,文本描述通过文本骨干编码器进行标记化获得文本标记;将图像标记和文本标记共同输入至非对称双边提示块中;在非对称双边提示块中,将图像和文本信息进行融合和交互;在解码阶段,利用一个由N个文本引导的解码块和一个最终的解码块组成的图像解码器,在文本信息的帮助下对图像标记进行上采样;输出通过分割头传递,从而获得感染区域的图像分割结果。本发明能够克服当前方法的主要局限性,即缺乏对文本标记的自适应调整和文本先验信息的充分利用。
技术关键词
图像分割方法 文本 标记 分支 编码器 图像解码器 上采样 注意力 投影器 译码器 投影仪 视觉 阶段 级联 通道 元素
系统为您推荐了相关专利信息
1
基于侧扫声呐与惯性传感器融合的无人艇定位方法、系统及介质
惯性传感器 无人艇 ORB特征 定位方法 侧扫声呐图像
2
基于数字化仪器的物理实验考试评判方法、装置及设备
数字孪生模型 评判方法 智能分析模型 区块链存证技术 物理
3
基于Bert模型的混合剪枝方法、设备及存储介质
掩码矩阵 注意力 剪枝方法 前馈神经网络 参数
4
一种新能源集群的智能协同控制方法
协同控制方法 聚光 方位角 光强 反射率
5
语言模型训练方法、设备、存储介质及计算机程序产品
语言模型训练方法 大语言模型 度量 标签文本 问答模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号