摘要
本发明公开一种基于自然语言处理的应急资源分类方法及系统,涉及数据分类技术领域。针对现有应急资源分类方法效率低和准确性差的问题,采用方案包括:S1、对于输入的应急资源文本数据,进行数据清洗、分词和词性标注;S2、提取文本词频特征,对文本词语进行加权,获取词语分布式表示并组合成文本向量;S3、构建应急资源分类模型,在模型输入层或中间层引入注意力机制;使用已标注的应急资源文本数据进行模型训练和优化,使模型输出应急资源文本属于不同类别的概率分布;S4、获取新应急资源文本,依次执行前述步骤,模型输出该文本属于不同类别的概率分布,选择概率最高的类别作为分类结果。本发明可以对应急资源进行自动分类管理。
技术关键词
文本
资源分类方法
词语
自然语言
引入注意力机制
分词
分类系统
数据特征提取
语义特征
分类模型训练
特征提取能力
随机梯度下降
中间层
词袋模型
处理单元
噪声信息
训练集
数据分类技术
系统为您推荐了相关专利信息
档案数据管理
标注方法
深度语义模型
语义向量
归一化模块
智能告警方法
预训练语言模型
文本
门控循环单元
深度学习模型