摘要
本公开提供一种文本检测方法、电子设备、介质及计算机程序产品,涉及数据处理技术领域,方法包括:获取目标对象的图像特征;将图像特征输入文本检测模型的第一解码器,得到第一特征,并根据第一特征,得到第一文本检测结果;将第一特征输入文本检测模型的第二解码器,得到第二特征,并根据第二特征,得到第二文本检测结果;其中,第一文本检测结果和第二文本检测结果为不同层级的文本检测结果,文本检测结果的层级包括:词级、行级,或者段落级。本发明可以同时获取多级文本检测结果,且不需要根据一个层级的文本检测结果,对另一个层级进行文本检测,而是根据第一特征获取各层级的文本检测结果,文本检测结果准确度高。
技术关键词
查询特征
文本检测模型
行解码器
文本检测方法
图像
融合特征
计算机程序产品
层级
多层感知器
交叉注意力机制
电子设备
存储计算机程序
数据处理技术
处理器
可读存储介质
对象
系统为您推荐了相关专利信息
隐形眼镜缺陷检测
图像采集系统
镜片
暗场照明
光束分束器
多模态特征融合
语义分割方法
融合特征
3D点云图像
球状
协同检测方法
掩膜板
集成电路
液晶可调滤光片
多光谱相机