摘要
本申请涉及一种图像处理方法、装置及存储介质,所述方法包括:获取待处理图像,并确定所述待处理图像中至少一个文本行对应的码元序列;预测所述码元序列中每个码元对应的类别,并根据所述类别,确定所述待处理图像中至少一个文本行各自对应的文本行特征;根据所述文本行特征,抽取所述待处理图像中的实体及所述实体的实体类别。如此利用现有的文字检测识别引擎,对文本行进行检测得到文本行检测结果,在此文本行检测结果下,确定待处理图像中至少一个文本行各自对应的文本行特征,进而根据文本行特征,抽取待处理图像中的实体及实体的实体类别,可以抽取出完整的实体。
技术关键词
文本行
实体
多模态
序列
图像处理方法
线性分类器
图像处理装置
图像获取模块
坐标
尺寸
处理器
程序
系统为您推荐了相关专利信息
多元时序数据
LNG储罐系统
量预测方法
多模态
注意力
大语言模型
讲解系统
语音识别引擎
接口模块
文本