摘要
本申请公开了自然场景文本检测和识别方法及相关装置,包括:获取初始图像数据和初始图像数据对应的目标应用场景;根据初始图像数据和目标应用场景从第一预训练模型库中获取初始文本检测模型以及从第二预训练模型库中获取初始文本识别模型;根据预设第一训练数据集训练初始文本检测模型得到目标文本检测模型,根据预设第二训练数据集训练初始文本识别模型得到目标文本识别模型;对初始图像数据进行预处理得到目标图像数据;将目标图像数据输入至目标文本检测模型得到目标文本区域;将目标文本区域输入至目标文本识别模型得到第一文本;对第一文本进行结果优化得到第二文本。采用本申请,实现了提高自然场景文本检测和识别的准确性。
技术关键词
文本检测模型
文本识别模型
自然场景文本检测
图像
模型库
数据
预训练模型
像素
识别方法
文本区域检测
编辑距离算法
参数
识别装置
特征提取方法
卷积滤波器
注意力
模型训练模块
系统为您推荐了相关专利信息
字体
文字内容信息
特征向量库
canny边缘检测
canny算法
口腔模型
建模方法
数据
非易失性存储介质
口内扫描仪
短接模块
图像分割方法
双线性插值
多尺度特征
输出特征
历史数据特征
识别方法
云数据中心
特征提取器
实时数据