摘要
本发明涉及一种用于智能客服系统的大规模文本数据清洗与标注方法。清洗与标注方法包括如下过程:预处理模块将长文本数据分割为多个不同的句子,得到文本数据模块;数据分配模块将文本数据模块分配到数据清洗层中与智能标注模型对应的清洗模块;智能标注模型从相应的存储区域获取相应的清洗后的文本数据模块,并对文本数据模块进行标注,从而生成相应的文本样本。本发明可以提高智能标注模型进行标注的准确性。
技术关键词
数据模块
大规模文本数据
智能客服系统
标注方法
清洗单元
子模块
数据存储模块
语义
清洗规则
词语
样本
代表
系统为您推荐了相关专利信息
状态空间模型
退化预测方法
变量
平稳轴承
退化特征
情感词库
情感分析系统
情感分析方法
多模态情感识别
智能客服系统
标注方法
云端数据中心
三维图像数据
无人机遥感
注意力机制