文本检测及文本检测模型训练方法、装置和设备

正文

推荐专利

申请号：CN202410841220

申请日期：2024-06-26

公开号：CN118840756A

公开日期：2024-10-25

类型：发明专利

摘要

本公开提供了一种文本检测及文本检测模型训练方法、装置和设备，涉及人工智能技术领域，尤其涉及计算机视觉、深度学习、大模型等技术领域，可应用于OCR等场景。文本预测方法包括：对目标图像进行特征提取，以获得所述目标图像的图像特征；所述目标图像中包含待检测文本；基于所述图像特征进行多个文本粒度的检测处理，以获得多种候选检测结果；所述多种候选检测结果与所述多个文本粒度一一对应；基于所述多种候选检测结果获取目标粒度的待处理检测结果；基于所述图像特征和所述待处理检测结果的目标位置特征进行分割处理，以获得所述待检测文本的所述目标粒度的目标检测结果。

技术关键词

注意力图像嵌入融合图像特征文本检测模型解码器掩码矩阵特征提取网络位置编码器检测头因子多尺度文本预测方法特征提取模块坐标

系统为您推荐了相关专利信息

一种基于语义对象关系的电力设备图像对比检索方法和系统

检索方法图像语义融合特征对象

一种锥形束CT图像重建方法、系统、设备及存储介质

锥形束CT图像投影特征三维体积图像分块特征提取特征提取模块

基于深度学习的循环肿瘤细胞识别模型训练方法及系统

深度卷积网络免疫细胞形态学特征多通道模型训练方法

一种基于改进的YOLO v8n算法的智能井下钻杆计数方法

计数网络模型计数方法网络模型结构算法轨迹

一种配低压配电台区的有功负荷预测方法及装置

低压配电台区负荷预测方法气象预报数据 CRF模型孤立森林算法

文本检测及文本检测模型训练方法、装置和设备

站点导航

APP 下载