基于大型语言模型的图像分割方法、装置、电子设备

AITNT
正文
推荐专利
基于大型语言模型的图像分割方法、装置、电子设备
申请号:CN202410845624
申请日期:2024-06-27
公开号:CN118941586A
公开日期:2024-11-12
类型:发明专利
摘要
本发明提供一种基于大型语言模型的图像分割方法、装置、电子设备,包括:获取待分割图像和问题文本,其中,问题文本用于指示待分割图像中的待分割目标;分别对所述待分割图像和问题文本进行特征提取处理,得到视觉嵌入向量和文本嵌入向量;基于所述视觉嵌入向量和所述文本嵌入向量确定所述待分割目标的中心点,并确定以所述中心点为起点的预设数量的射线,其中,所述射线的终点用于指示所述待分割目标的轮廓;基于所述预设数量的射线对所述待分割图像进行分割处理,得到所述待分割目标。通过中心点和以中心点为起点的预设数量的射线自适应地确定待分割目标的轮廓,能够精确保留待分割图像的轮廓形状信息,有效提高了图像分割时的分割精度。
技术关键词
图像分割方法 射线 文本 视觉 非暂态计算机可读存储介质 终点 图像编码 图像分割装置 电子设备 处理器 特征提取模块 计算机程序产品 轮廓形状 分辨率 存储器 坐标
系统为您推荐了相关专利信息
1
一种基于多模态语义图与提示学习结合的对话推荐方法
语义 对话推荐方法 实体 文本 预训练模型
2
一种高质量直播营销文本识别方法
文本识别方法 预训练网络 图片 评论文本分析 文本生成图像
3
液态金属内多气泡相场可视化重构方法、装置及设备
超声换能器 重构模型 超声信号 序列 动态
4
基于三维几何一致注意力先验的交互式三维高斯编辑方法及系统
注意力先验 编辑方法 语义 动态门控 场景编辑系统
5
一种基于视觉和语言的X光片分析方法及装置
大语言模型 分析方法 跨模态 注意力 图像
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号