自然场景文本检测和识别方法及相关装置

AITNT
正文
推荐专利
自然场景文本检测和识别方法及相关装置
申请号:CN202510296644
申请日期:2025-03-11
公开号:CN120198904A
公开日期:2025-06-24
类型:发明专利
摘要
本申请公开了自然场景文本检测和识别方法及相关装置,包括:获取初始图像数据和初始图像数据对应的目标应用场景;根据初始图像数据和目标应用场景从第一预训练模型库中获取初始文本检测模型以及从第二预训练模型库中获取初始文本识别模型;根据预设第一训练数据集训练初始文本检测模型得到目标文本检测模型,根据预设第二训练数据集训练初始文本识别模型得到目标文本识别模型;对初始图像数据进行预处理得到目标图像数据;将目标图像数据输入至目标文本检测模型得到目标文本区域;将目标文本区域输入至目标文本识别模型得到第一文本;对第一文本进行结果优化得到第二文本。采用本申请,实现了提高自然场景文本检测和识别的准确性。
技术关键词
文本检测模型 文本识别模型 自然场景文本检测 图像 模型库 数据 预训练模型 像素 识别方法 文本区域检测 编辑距离算法 参数 识别装置 特征提取方法 卷积滤波器 注意力 模型训练模块
系统为您推荐了相关专利信息
1
一种基于多特征融合的字体检索方法、装置、设备和介质
字体 文字内容信息 特征向量库 canny边缘检测 canny算法
2
口腔建模方法、系统、装置及非易失性存储介质
口腔模型 建模方法 数据 非易失性存储介质 口内扫描仪
3
一种基于融合CNN和Transformer的河湖沿岸建筑图像分割方法
短接模块 图像分割方法 双线性插值 多尺度特征 输出特征
4
一种多相机采集图像拼接方法
图像拼接方法 图案 矫正 标定板图像 坐标
5
一种基于图像识别的餐品识别方法及系统
历史数据特征 识别方法 云数据中心 特征提取器 实时数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号