分割工业表面缺陷图片的交互式微调SAM及其训练方法

AITNT
正文
推荐专利
分割工业表面缺陷图片的交互式微调SAM及其训练方法
申请号:CN202510166491
申请日期:2025-02-14
公开号:CN119648725A
公开日期:2025-03-18
类型:发明专利
摘要
本发明提出了一种分割工业表面缺陷图片的交互式微调SAM及其训练方法,属于图像分割技术领域。微调SAM包括:图像编码器、提示编码器、掩码解码器,图像编码器和掩码解码器嵌入有适配器结构,所述适配器结构包含向下投影、ReLU激活函数和向上投影,其中向下投影使用多层感知器层将给定的嵌入压缩到较低的维度,ReLU激活函数负责进行非线性变换,而向上投影使用另一个多层感知器层将压缩的嵌入扩展回其原始维度。在微调过程中充分考虑了用户的交互习惯,经过实验发现,这种微调技术在十种对比的微调方法中的实验结果最好,为用户在工业表面缺陷场景上的交互式图像分割提供了有效的解决方案。
技术关键词
图像编码器 多层感知器 适配器结构 解码器 图片 嵌入适配器 工业 双向注意力 交互式图像分割 图像嵌入 训练装置 图像分割技术 非线性 微调技术 变压器 微调方法 参数
系统为您推荐了相关专利信息
1
基于大核注意力机制的医学图像融合方法及系统
医学图像融合方法 注意力机制 多模态医学图像 空间特征提取 多尺度
2
一种基于大模型微调的网络流量生成方法
网络流量生成方法 专业知识库 图谱 注意力机制 解码器
3
一种基于深度学习的口腔全景片图像分割以辅助诊断骨质疏松的方法及系统
诊断骨质疏松 深度学习模型 图像数据预处理 深度学习图像 标定工具
4
一种基于多模型网络耦合的交通流量预测方法
交通流量预测方法 多模型 attention机制 注意力 数据
5
基于条件多模态提示的机器人精细化目标定位方法及装置
视觉特征 机器人 多模态 定位方法 编码
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号