摘要
本发明提出了一种分割工业表面缺陷图片的交互式微调SAM及其训练方法,属于图像分割技术领域。微调SAM包括:图像编码器、提示编码器、掩码解码器,图像编码器和掩码解码器嵌入有适配器结构,所述适配器结构包含向下投影、ReLU激活函数和向上投影,其中向下投影使用多层感知器层将给定的嵌入压缩到较低的维度,ReLU激活函数负责进行非线性变换,而向上投影使用另一个多层感知器层将压缩的嵌入扩展回其原始维度。在微调过程中充分考虑了用户的交互习惯,经过实验发现,这种微调技术在十种对比的微调方法中的实验结果最好,为用户在工业表面缺陷场景上的交互式图像分割提供了有效的解决方案。
技术关键词
图像编码器
多层感知器
适配器结构
解码器
图片
嵌入适配器
工业
双向注意力
交互式图像分割
图像嵌入
训练装置
图像分割技术
非线性
微调技术
变压器
微调方法
参数
系统为您推荐了相关专利信息
医学图像融合方法
注意力机制
多模态医学图像
空间特征提取
多尺度
网络流量生成方法
专业知识库
图谱
注意力机制
解码器
诊断骨质疏松
深度学习模型
图像数据预处理
深度学习图像
标定工具
交通流量预测方法
多模型
attention机制
注意力
数据