摘要
本发明揭示了一种基于少量标签的文章文本分类方法,在准备阶段依次完成制备文章文本、制备文本类别对、制备抽取式文本摘要模型,制备文本摘要相似度模型,制备句子集相似度模型,生成文本的表征向量,制备文章类型标签。而在预测阶段对待分类文章处理得文本、文章结构、句子数据,并利用抽取式摘要模型和摘要相似度模型处理得到文章结构各部分的摘要,再处理得到各部分的表征向量后计算与对应项目的相似度,通过加权和计算和设定阈值完成类别归属。本发明在文章文本分类过程中充分考虑文章题目、结构及内容相关性对类别确定的影响,突出文章中关键句的重要性,提升了分类准确性;有利于快速增加新分类且降低了成本。
技术关键词
文章
文本分类方法
文本摘要模型
标记
标签
传播算法
数据
清洗工具
网络架构
项目
基础
参数
阶段
互联网
关系
队列
符号
系统为您推荐了相关专利信息
宽频
定位方法
节点特征
算法
电力系统优化控制技术
模拟显示方法
数字化地形
语义标签
语义分割技术
深度强化学习
可见光图像
红外光
识别模型训练方法
行人重识别模型
语义
纹理识别方法
触觉传感器
磁流变弹性体
霍尔传感器阵列
触觉感知技术