摘要
本发明提供一种基于大型语言模型的图像分割方法、装置、电子设备,包括:获取待分割图像和问题文本,其中,问题文本用于指示待分割图像中的待分割目标;分别对所述待分割图像和问题文本进行特征提取处理,得到视觉嵌入向量和文本嵌入向量;基于所述视觉嵌入向量和所述文本嵌入向量确定所述待分割目标的中心点,并确定以所述中心点为起点的预设数量的射线,其中,所述射线的终点用于指示所述待分割目标的轮廓;基于所述预设数量的射线对所述待分割图像进行分割处理,得到所述待分割目标。通过中心点和以中心点为起点的预设数量的射线自适应地确定待分割目标的轮廓,能够精确保留待分割图像的轮廓形状信息,有效提高了图像分割时的分割精度。
技术关键词
图像分割方法
射线
文本
视觉
非暂态计算机可读存储介质
终点
图像编码
图像分割装置
电子设备
处理器
特征提取模块
计算机程序产品
轮廓形状
分辨率
存储器
坐标
系统为您推荐了相关专利信息
文本识别方法
预训练网络
图片
评论文本分析
文本生成图像
注意力先验
编辑方法
语义
动态门控
场景编辑系统