一种数据标注方法、装置、设备及存储介质

正文

推荐专利

一种数据标注方法、装置、设备及存储介质

申请号：CN202510117846

申请日期：2025-01-24

公开号：CN120182982A

公开日期：2025-06-20

类型：发明专利

摘要

本申请实施例提供一种数据标注方法、装置、设备及存储介质，所述方法可以在获取待标注数据后，根据图像类型，构建识别模板。并获取待标注数据的文字识别数据，以及基于识别模板，在文字识别数据中提取标题数据和内容数据，从而根据标题数据、内容数据以及识别模板生成标注数据。其中，所述标题数据为与标题部分相似度大于或等于相似度阈值的文字内容；所述内容数据为根据文字坐标和内容部分对应位置确定的文字内容。所述方法能够用于OCR训练数据的标注任务中，通过OCR算法模型和数据处理脚本对OCR识别结果进行错误文字修正、错误文字提醒以及文本结构恢复，可有效提升训练数据的标注效率。

技术关键词

模板数据标注方法算法模型图像坐标文本脚本锚点深度学习模型标注装置数据获取模块处理器格式服务器计算机设备标记识别模块接口

系统为您推荐了相关专利信息

分子、离子基态总自旋计算方法及电子设备

分子伊辛模型计算方法离子轨道

基于大模型的视频通话处理方法、装置、电子设备、介质和程序产品

视频通话场景视频通话数据大语言模型多模态人像特征

基于图像识别的ROS中GAZEBO建模方法

建模方法滑动窗口灰度直方图仿真模型墙体

声纳图像差别区域分界线检测方法、装置、设备及介质

特征值 OTSU算法亮点滑动平均滤波图像处理技术

基于扰动特征恢复的神经网络特定误分类修复方法

特征提取器分类图像数据原始图像数据修复方法样本

一种数据标注方法、装置、设备及存储介质

站点导航

APP 下载