基于大型语言模型的图像分割方法、装置、电子设备

正文

推荐专利

申请号：CN202410845624

申请日期：2024-06-27

公开号：CN118941586A

公开日期：2024-11-12

类型：发明专利

摘要

本发明提供一种基于大型语言模型的图像分割方法、装置、电子设备，包括：获取待分割图像和问题文本，其中，问题文本用于指示待分割图像中的待分割目标；分别对所述待分割图像和问题文本进行特征提取处理，得到视觉嵌入向量和文本嵌入向量；基于所述视觉嵌入向量和所述文本嵌入向量确定所述待分割目标的中心点，并确定以所述中心点为起点的预设数量的射线，其中，所述射线的终点用于指示所述待分割目标的轮廓；基于所述预设数量的射线对所述待分割图像进行分割处理，得到所述待分割目标。通过中心点和以中心点为起点的预设数量的射线自适应地确定待分割目标的轮廓，能够精确保留待分割图像的轮廓形状信息，有效提高了图像分割时的分割精度。

技术关键词

图像分割方法射线文本视觉非暂态计算机可读存储介质终点图像编码图像分割装置电子设备处理器特征提取模块计算机程序产品轮廓形状分辨率存储器坐标

系统为您推荐了相关专利信息

一种基于多模态语义图与提示学习结合的对话推荐方法

语义对话推荐方法实体文本预训练模型

一种高质量直播营销文本识别方法

文本识别方法预训练网络图片评论文本分析文本生成图像

液态金属内多气泡相场可视化重构方法、装置及设备

超声换能器重构模型超声信号序列动态

基于三维几何一致注意力先验的交互式三维高斯编辑方法及系统

注意力先验编辑方法语义动态门控场景编辑系统

一种基于视觉和语言的X光片分析方法及装置

大语言模型分析方法跨模态注意力图像

基于大型语言模型的图像分割方法、装置、电子设备

站点导航

APP 下载