摘要
本发明公开了一种基于深度学习的自动化数据标注方法及系统,涉及数据标注技术领域,包括从多源数据源中收集文本数据进行预处理并提取数据词向量,对小规模的文本数据进行初步手动标注并构建动态提示模板;基于动态提示模板构建深度学习模型进行自动化数据标注并评估标注数据的质量;将标注后的数据存储在数据库中并实施访问控制。本发明通过预处理多源数据并构建词汇共现矩阵和混合词向量模型深入提取多源数据的词向量进行融合,根据手动标注的样本构建动态提示模板并基于动态模板数据构建深度学习模型进行自动化数据标注,提供了高质量的词向量进行模型的训练有助于模型更准确的执行标注任务,提高了数据标注的自动化水平和标注数据的质量。
技术关键词
数据标注方法
词向量模型
文本
深度学习模型
节点特征
模板
动态
轮廓系数
小规模
数据标注技术
数据标注系统
数据存储
词向量构建
聚类算法
深度学习训练
访问控制策略
邻居
BERT模型
系统为您推荐了相关专利信息
指标
微服务实例
门控循环单元网络
定位方法
离线
企业信用评价方法
LDA模型
技术对企业
序列特征
数据
胶囊神经网络
稽核方法
非易失性存储介质
图像
多模态