摘要
本发明涉及图像数据处理领域,更具体地,涉及一种参考图像分割方法及系统,所述分割方法利用预训练的视觉理解模型提取参考图像和文本描述的参考描述文本,进而获取对象增强文本特征。对参考图像裁切得固定大小的裁切块,通过多模态预训练模型提取图像特征并计算与对象增强文本特征的相似度,形成相似度分数图并设置点提示;通过预训练的图像分割模型根据点提示生成掩码,实现参考图像的分割。与现有技术相比,通过预训练的视觉理解模型、多模态预训练模型和图像分割模型,来实现对参考图像和输入文本的处理,这些预训练的模型预先学习了丰富的图像和文本特征,能够节省大量的训练时间和资源,并能够在零训练的条件下,实现对参考图像的分割。
技术关键词
图像分割方法
文本
切块
图像分割模型
网格
预训练模型
滑动窗口
对象
图像分割系统
图像数据处理
多模态
特征提取模块
视觉
度函数
尺寸
资源
系统为您推荐了相关专利信息
图像分割方法
掩膜
图像分割模型
二值化图像
计算机程序产品
地形建模方法
三角网格模型
水动力学模型
加权方法
影像
机车撒砂装置
三维模型
应力
网格模型
计算机程序产品
试卷自动评阅方法
文本
校正
Word2Vec模型
查询方法