文本检测及文本检测模型训练方法、装置和设备

AITNT
正文
推荐专利
文本检测及文本检测模型训练方法、装置和设备
申请号:CN202410841220
申请日期:2024-06-26
公开号:CN118840756A
公开日期:2024-10-25
类型:发明专利
摘要
本公开提供了一种文本检测及文本检测模型训练方法、装置和设备,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于OCR等场景。文本预测方法包括:对目标图像进行特征提取,以获得所述目标图像的图像特征;所述目标图像中包含待检测文本;基于所述图像特征进行多个文本粒度的检测处理,以获得多种候选检测结果;所述多种候选检测结果与所述多个文本粒度一一对应;基于所述多种候选检测结果获取目标粒度的待处理检测结果;基于所述图像特征和所述待处理检测结果的目标位置特征进行分割处理,以获得所述待检测文本的所述目标粒度的目标检测结果。
技术关键词
注意力 图像嵌入 融合图像特征 文本检测模型 解码器 掩码矩阵 特征提取网络 位置编码器 检测头 因子 多尺度 文本预测方法 特征提取模块 坐标
系统为您推荐了相关专利信息
1
一种基于语义对象关系的电力设备图像对比检索方法和系统
检索方法 图像 语义 融合特征 对象
2
一种锥形束CT图像重建方法、系统、设备及存储介质
锥形束CT图像 投影特征 三维体积图像 分块特征提取 特征提取模块
3
基于深度学习的循环肿瘤细胞识别模型训练方法及系统
深度卷积网络 免疫细胞 形态学特征 多通道 模型训练方法
4
一种基于改进的YOLO v8n算法的智能井下钻杆计数方法
计数网络模型 计数方法 网络模型结构 算法 轨迹
5
一种配低压配电台区的有功负荷预测方法及装置
低压配电台区 负荷预测方法 气象预报数据 CRF模型 孤立森林算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号