摘要
本申请涉及一种输入图像类别识别方法、装置、计算机设备及存储介质,所述方法包括下述步骤:对输入图像进行预处理,得到标准输入图像;基于预训练的OCR模型结合多边形拟合技术对标准输入图像提取文字信息;根据文字信息的关键词、主题、上下文信息初步分类,得到初步分类结果;采用分层特征融合方法对标准输入图像的视觉特征、文本特征、初步分类结果进行特征融合,得到图像融合特征;根据图像融合特征和预存的图像模版特征对标准输入图像进行类别划分,得到输入图像类别。本申请可应用于金融业务系统应用场景中,能够有效实现对金融业务系统中的输入图像进行准确类别识别,以方便后续系统进行图像信息录入。
技术关键词
图像类别
融合特征
识别方法
文本
计算机可读指令
分层特征
金融业务系统
融合方法
模版
多边形
关键词提取方法
计算机设备
主题
分类特征
样本
语义信息提取
视觉特征提取
系统为您推荐了相关专利信息
建筑工程墙体
可视化检测方法
检测墙体
均匀性特征
结构模型数据
电力设备铭牌图像
预处理图像数据
生成结构化数据
运维方法
二值图像数据
文本处理模型
生成方法
词频统计
对象
条件随机场模型
多模态特征融合
生成方法
数据
大语言模型
复杂度