摘要
本申请适用于图像处理技术领域,提供了一种图像处理方法、装置、计算机设备和计算机程序产品,方法包括:对高分辨率图像进行切分,得到多个子图,以及对所述高分辨率图像进行尺寸调整,得到所述高分辨率图像的全信息图;基于多个所述子图和所述全信息图,得到视觉特征;获取与所述高分辨率图像关联的文本特征;将所述视觉特征和所述文本特征,输入多模态大模型中得到所述高分辨率图像的模型识别结果。从而可以显著提高模型对高分辨率图像内容的识别准确性。
技术关键词
视觉特征
图像处理方法
计算机程序产品
计算机设备
分辨率
多模态
文本
策略
网格
长宽比
图像处理装置
图像处理技术
尺寸
处理器
模块
存储器
注意力
编码