自然场景文本检测和识别方法及相关装置

正文

推荐专利

自然场景文本检测和识别方法及相关装置

申请号：CN202510296644

申请日期：2025-03-11

公开号：CN120198904A

公开日期：2025-06-24

类型：发明专利

摘要

本申请公开了自然场景文本检测和识别方法及相关装置，包括：获取初始图像数据和初始图像数据对应的目标应用场景；根据初始图像数据和目标应用场景从第一预训练模型库中获取初始文本检测模型以及从第二预训练模型库中获取初始文本识别模型；根据预设第一训练数据集训练初始文本检测模型得到目标文本检测模型，根据预设第二训练数据集训练初始文本识别模型得到目标文本识别模型；对初始图像数据进行预处理得到目标图像数据；将目标图像数据输入至目标文本检测模型得到目标文本区域；将目标文本区域输入至目标文本识别模型得到第一文本；对第一文本进行结果优化得到第二文本。采用本申请，实现了提高自然场景文本检测和识别的准确性。

技术关键词

文本检测模型文本识别模型自然场景文本检测图像模型库数据预训练模型像素识别方法文本区域检测编辑距离算法参数识别装置特征提取方法卷积滤波器注意力模型训练模块

系统为您推荐了相关专利信息

一种基于多特征融合的字体检索方法、装置、设备和介质

字体文字内容信息特征向量库 canny边缘检测 canny算法

口腔建模方法、系统、装置及非易失性存储介质

口腔模型建模方法数据非易失性存储介质口内扫描仪

一种基于融合CNN和Transformer的河湖沿岸建筑图像分割方法

短接模块图像分割方法双线性插值多尺度特征输出特征

一种多相机采集图像拼接方法

图像拼接方法图案矫正标定板图像坐标

一种基于图像识别的餐品识别方法及系统

历史数据特征识别方法云数据中心特征提取器实时数据

自然场景文本检测和识别方法及相关装置

站点导航

APP 下载