摘要
本公开提供了一种图像处理方法、装置、电子设备和存储介质,涉及人工智能技术领域,尤其涉及图像处理领域和大模型领域。具体实现方案为:对第一图像中各个文本区域进行文本识别,得到多个目标对象名称文本段和各个目标对象名称文本段在第一图像中的位置信息;基于多个目标对象名称文本段,确定名称类别;基于名称类别,对第一图像中各个目标对象图像区域进行分割,得到多个目标对象图像以及各个目标对象图像中目标对象在第一图像中的位置信息;基于各个目标对象名称文本段在第一图像中的位置信息,以及各个目标对象图像中目标对象在第一图像中的位置信息,对多个目标对象名称文本段与多个目标对象图像进行一一匹配,得到多个文本段与图像组合。
技术关键词
图像组合
对象
文本识别
大语言模型
中央处理器执行
图像处理方法
图像分割模型
图文
匹配模块
电子设备
图像处理装置
人工智能技术
计算机程序产品
指令
系统为您推荐了相关专利信息
递归神经网络
图像分割方法
局部特征信息
时序特征
卷积神经网络提取
单目深度估计
轻量级卷积神经网络
深度图
编码器架构
虚拟对象
实体识别方法
实体识别模型
CRF模型
训练神经网络模型
生成数据集
三维场景数据
解析方法
非易失存储单元
简化算法
生成方法