基于视觉提示的文本检测模型的训练方法及文本检测方法

正文

推荐专利

申请号：CN202411008089

申请日期：2024-07-25

公开号：CN118968518A

公开日期：2024-11-15

类型：发明专利

摘要

本申请实施例提供了基于视觉提示的文本检测模型的训练方法及文本检测方法，涉及图像处理技术领域。训练方法包括：获取样本图像集；提取样本图像的图像特征，并确定样本图像中文本区域的视觉提示特征；针对每张样本图像，将图像特征和各文本区域的视觉提示特征输入至文本检测模型，以使文本检测模型对图像特征和每一文本区域的视觉提示特征进行融合，基于融合特征，利用位置检测器进行预测，得到样本图像对应的预测结果；基于各样本图像的标签信息与对应的预测结果，对文本检测模型进行模型参数调整。应用本申请实施例提供的方案，可以在不依赖于待检测的工业场景的场景图像作为样本图像的前提下，训练得到适用于待检测的工业场景的文本检测模型。

技术关键词

文本检测模型样本位置检测器视觉多模态特征融合文本检测方法融合特征特征提取模块字符识别器场景图像获取模块标签工业可读存储介质图像采集模块图像处理技术表达式

系统为您推荐了相关专利信息

一种基于机器人视觉的材料输送装置

材料输送装置机器人视觉围板视觉检测组件落料组件

光伏功率预测方法、装置和计算机程序产品

数值天气预报数据光伏发电站光伏功率预测方法曲线计算机程序产品

一种基于人工智能的数据处理方法、装置及电子设备

数据分类模型文件夹数据访问目录层级

一种晶圆测试分类方法及系统

分类方法生成测试报告测试仪器平均无故障时间样本

一种基于人机交互的光伏清扫机器人路径规划方法和系统

光伏清扫机器人光伏板路径规划方法光伏发电场额定工作温度

基于视觉提示的文本检测模型的训练方法及文本检测方法

站点导航

APP 下载