摘要
本申请涉及图像处理技术领域,尤其涉及一种基于大模型的目标物体识别方法及设备。分别基于目标识别大模型和目标识别小模型在待识别图像中识别候选目标的位置,再确定待识别图像中的包括了每个候选目标的目标子图像,将目标子图像输入到目标识别大模型,确定包括了每个目标物体的子图像的子图像集,降低了输入到目标识别大模型中的图像的分辨率,去掉了其他无关区域,使目标识别大模型更加专注包括候选目标的图像区域,将每个目标物体对应的子图像以及第一提示文本输入到目标识别大模型中,得到每个子图像中包括的目标物体的描述文本,从而根据描述文本确定每个目标物体所归属的类别,提高了目标识别大模型识别目标物体的准确率。
技术关键词
物体识别方法
分辨率
文本编码器
矩阵
适配器
图像处理技术
大语言模型
样本
电子设备
指令
视觉
处理器
数据
存储器
系统为您推荐了相关专利信息
高分辨率遥感影像
对象
语义建模方法
地形特征提取
信息系统
图像生成模型
图像生成方法
对象
纹理特征
适配器
控制系统模型
安全控制方法
时间控制器
轨迹跟踪控制器
建立控制系统