摘要
本申请公开了一种数据标记方法、装置及机器可读存储介质,涉及计算机技术领域。方法包括:基于预设聚类数量对待标记数据对应的文本向量进行文本聚类,得到文本聚类结果;在文本聚类结果满足预设聚类条件时,基于文本聚类结果对待标记数据进行文本标记,得到第一标记;将待标记数据输入至预设实体识别模型,得到实体;基于实体对待标记数据进行实体标记,得到第二标记;将实体进行组合,并确定对应的实体组合向量;将实体组合向量进行实体聚类,并基于实体聚类结果对待标记数据进行实体组合标记,得到第三标记;基于第一标记、第二标记及第三标记,生成待标记数据的标记。结合文本聚类、实体识别和实体聚类的优点,提高数据标记的准确性和效率。
技术关键词
数据标记方法
聚类
文本
机器可读存储介质
实体识别模型
指令
存储器
处理器
样本
系统为您推荐了相关专利信息
鉴定中药材
根茎类中药材
样本
节点特征
神经网络模型
语义知识图谱
计算机视觉技术
问答语料
命名实体识别
分层树状结构
试车平台
随机森林模型
航空发动机传感器
试车方法
训练深度学习模型
序列推荐方法
标识符
矩阵
融合多模态信息
融合多模态特征