基于视觉提示的文本检测模型的训练方法及文本检测方法

AITNT
正文
推荐专利
基于视觉提示的文本检测模型的训练方法及文本检测方法
申请号:CN202411008089
申请日期:2024-07-25
公开号:CN118968518A
公开日期:2024-11-15
类型:发明专利
摘要
本申请实施例提供了基于视觉提示的文本检测模型的训练方法及文本检测方法,涉及图像处理技术领域。训练方法包括:获取样本图像集;提取样本图像的图像特征,并确定样本图像中文本区域的视觉提示特征;针对每张样本图像,将图像特征和各文本区域的视觉提示特征输入至文本检测模型,以使文本检测模型对图像特征和每一文本区域的视觉提示特征进行融合,基于融合特征,利用位置检测器进行预测,得到样本图像对应的预测结果;基于各样本图像的标签信息与对应的预测结果,对文本检测模型进行模型参数调整。应用本申请实施例提供的方案,可以在不依赖于待检测的工业场景的场景图像作为样本图像的前提下,训练得到适用于待检测的工业场景的文本检测模型。
技术关键词
文本检测模型 样本 位置检测器 视觉 多模态特征融合 文本检测方法 融合特征 特征提取模块 字符识别器 场景 图像获取模块 标签 工业 可读存储介质 图像采集模块 图像处理技术 表达式
系统为您推荐了相关专利信息
1
一种基于机器人视觉的材料输送装置
材料输送装置 机器人视觉 围板 视觉检测组件 落料组件
2
光伏功率预测方法、装置和计算机程序产品
数值天气预报数据 光伏发电站 光伏功率预测方法 曲线 计算机程序产品
3
一种基于人工智能的数据处理方法、装置及电子设备
数据分类模型 文件夹 数据访问 目录 层级
4
一种晶圆测试分类方法及系统
分类方法 生成测试报告 测试仪器 平均无故障时间 样本
5
一种基于人机交互的光伏清扫机器人路径规划方法和系统
光伏清扫机器人 光伏板 路径规划方法 光伏发电场 额定工作温度
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号