摘要
本申请实施例提供了基于视觉提示的文本检测模型的训练方法及文本检测方法,涉及图像处理技术领域。训练方法包括:获取样本图像集;提取样本图像的图像特征,并确定样本图像中文本区域的视觉提示特征;针对每张样本图像,将图像特征和各文本区域的视觉提示特征输入至文本检测模型,以使文本检测模型对图像特征和每一文本区域的视觉提示特征进行融合,基于融合特征,利用位置检测器进行预测,得到样本图像对应的预测结果;基于各样本图像的标签信息与对应的预测结果,对文本检测模型进行模型参数调整。应用本申请实施例提供的方案,可以在不依赖于待检测的工业场景的场景图像作为样本图像的前提下,训练得到适用于待检测的工业场景的文本检测模型。
技术关键词
文本检测模型
样本
位置检测器
视觉
多模态特征融合
文本检测方法
融合特征
特征提取模块
字符识别器
场景
图像获取模块
标签
工业
可读存储介质
图像采集模块
图像处理技术
表达式
系统为您推荐了相关专利信息
材料输送装置
机器人视觉
围板
视觉检测组件
落料组件
数值天气预报数据
光伏发电站
光伏功率预测方法
曲线
计算机程序产品
分类方法
生成测试报告
测试仪器
平均无故障时间
样本
光伏清扫机器人
光伏板
路径规划方法
光伏发电场
额定工作温度