摘要
本说明书实施例公开了一种标注和清洗协同的数据处理方法、设备及介质,涉及数据处理技术领域,方法包括:获取原始数据集,提取原始数据集中的语义特征,对原始数据集进行标记,生成标注引导热力数据;将标注引导热力数据输入标注节点,实时采集标注节点的目标用户在标注引导热力数据中的标注行为交互数据,标注行为交互数据包括操作数据坐标序列和坐标修正序列;基于标注行为交互数据,识别语义存疑区域,以通过清洗节点对语义存疑区域进行实体边界检测,生成对应的语义级清洗建议;根据语义级清洗建议对语义存疑区域的标注进行修正,确定原始数据集对应的标注信息,并根据语义级清洗建议,对数据清洗规则进行优化,以实现数据清洗。
技术关键词
数据处理方法
坐标
文本
清洗规则
序列
非易失性计算机存储介质
计算机可执行指令
节点
图像
语义特征
边缘检测模型
标记
标签
数据处理设备
逻辑
数据处理技术
标注工具
处理器