摘要
本发明公开了一种图像提示传播方法,其包括步骤:步骤1:根据用户提供的提示及模版图片初始化锚点集合;步骤2:使用增强的点对应方法将锚点由模板传递到序列中的除模版之外的图片;步骤3:对于每张图片,从该图片对应的锚点中选择提示点并与图片一起输入SAM进行提示选择分析;步骤4:评估提示选择结果,达标后直接输出,否则重新挑选更合适的提示。本发明无需针对不同场景进行训练,可直接获取大量图片中的提示用于理解图片,同时其具有很强的适应性,可以适应任何随着基础AI模型不断发展而产生的新技术,从而实现持续的性能提升,可以扩展到其他需要提示的视觉基础模型。
技术关键词
图片
掩膜
锚点
图像
分治算法
模版
模板
标签
特征点
感兴趣
序列
轮廓
节点
基础
视觉
坐标
标记
场景
关系
系统为您推荐了相关专利信息
视觉特征
多模态信息
注意力机制
文本编码器
深度学习模型
三维点云模型
图像
模拟输电线路
拉格朗日方程
匹配误差
三维CT图像
路径规划方法
终点
手术机器人
路径规划装置
工业缺陷检测
图像编码器
工业产品图像
文本编码器
语义标签
数据采集模块
光斑
数据转换单元
像素
总线连接器