基于少量标签的文章文本分类方法

AITNT
正文
推荐专利
基于少量标签的文章文本分类方法
申请号:CN202410733190
申请日期:2024-06-07
公开号:CN118445418A
公开日期:2024-08-06
类型:发明专利
摘要
本发明揭示了一种基于少量标签的文章文本分类方法,在准备阶段依次完成制备文章文本、制备文本类别对、制备抽取式文本摘要模型,制备文本摘要相似度模型,制备句子集相似度模型,生成文本的表征向量,制备文章类型标签。而在预测阶段对待分类文章处理得文本、文章结构、句子数据,并利用抽取式摘要模型和摘要相似度模型处理得到文章结构各部分的摘要,再处理得到各部分的表征向量后计算与对应项目的相似度,通过加权和计算和设定阈值完成类别归属。本发明在文章文本分类过程中充分考虑文章题目、结构及内容相关性对类别确定的影响,突出文章中关键句的重要性,提升了分类准确性;有利于快速增加新分类且降低了成本。
技术关键词
文章 文本分类方法 文本摘要模型 标记 标签 传播算法 数据 清洗工具 网络架构 项目 基础 参数 阶段 互联网 关系 队列 符号
系统为您推荐了相关专利信息
1
一种基于WOA-VMD算法的宽频振荡定位方法
宽频 定位方法 节点特征 算法 电力系统优化控制技术
2
一种基于AI的老旧小区改造地形模拟显示方法及系统
模拟显示方法 数字化地形 语义标签 语义分割技术 深度强化学习
3
一种基于多模态协同学习框架的重识别模型训练方法及系统
可见光图像 红外光 识别模型训练方法 行人重识别模型 语义
4
一种纹理识别方法、系统、介质、设备及触觉传感器
纹理识别方法 触觉传感器 磁流变弹性体 霍尔传感器阵列 触觉感知技术
5
一种企业数字化架构智能成图实现方法和系统
资产 国家电网 知识图谱技术 标签管理 企业
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号