摘要
本发明公开了一种智能数据标注方法及系统,涉及文本处理技术领域,包括:数据采集模块,所述数据采集模块获取等待标注的文本文档集;数据预处理模块。通过设置分布式集群模块、智能引擎处理模块和智能引擎分析模块,使用计算机系统对等待标注的文本文档集进行处理,提升处理速度,减轻人力,同时,建立数据分析包和文本待标注示意,根据数据分析包,对文本作出分析,判断文本需要标注的信息,文本需要标注的信息包括有生僻词语、专业术语以及成语词汇等,接着匹配文本标注,对生僻词语、专业术语以及成语词汇等做出高精度的延伸解释,此外,可视化模块将文本标注可视化呈现,便于阅读者记忆。
技术关键词
数据标注方法
数据分析包
切片
连续型
节点
可视化模块
异常数据
数据采集模块
模式识别技术
分析模块
训练样本集
分类器
数据标注系统
文本处理技术
训练预测模型
支路
数据库系统
系统为您推荐了相关专利信息
无线网络系统
天线阵列
微基站
天线单元
网络监控数据