摘要
本发明涉及自然语言处理技术领域,具体涉及一种基于自然语言处理技术的数据分类标注方法。其先获取待进行分类标注的样本数据,然后根据样本数据的数据类型,基于样本数据的内容建立样本数据对应的描述文本,然后基于自然语言处理技术分析描述文本的文本内容,得到和描述文本匹配的标注标签,最后基于标注标签进行标注和分类。本发明通过统一的数据处理框架,能够适应不同类型的数据,只需将其转化为描述文本即可进行后续处理,避免了传统方法中针对不同数据类型开发独立模型的低效问题,解决了现有技术中的分类标注方式泛化能力不足的问题。
技术关键词
自然语言
标注方法
数据分类
文本
样本
标签
意图
周期性特征
统计特征
全局统计分析
滑动窗口
实体
数据处理框架
情感分析模型
标注系统
程序
处理器
分析模块
可读存储介质