摘要
本公开提供了一种文本检测及文本检测模型训练方法、装置和设备,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于OCR等场景。文本预测方法包括:对目标图像进行特征提取,以获得所述目标图像的图像特征;所述目标图像中包含待检测文本;基于所述图像特征进行多个文本粒度的检测处理,以获得多种候选检测结果;所述多种候选检测结果与所述多个文本粒度一一对应;基于所述多种候选检测结果获取目标粒度的待处理检测结果;基于所述图像特征和所述待处理检测结果的目标位置特征进行分割处理,以获得所述待检测文本的所述目标粒度的目标检测结果。
技术关键词
注意力
图像嵌入
融合图像特征
文本检测模型
解码器
掩码矩阵
特征提取网络
位置编码器
检测头
因子
多尺度
文本预测方法
特征提取模块
坐标
系统为您推荐了相关专利信息
锥形束CT图像
投影特征
三维体积图像
分块特征提取
特征提取模块
深度卷积网络
免疫细胞
形态学特征
多通道
模型训练方法
低压配电台区
负荷预测方法
气象预报数据
CRF模型
孤立森林算法