基于轻量级样本数据的文本分类方法及装置

正文

推荐专利

基于轻量级样本数据的文本分类方法及装置

申请号：CN202510205243

申请日期：2025-02-24

公开号：CN119988613A

公开日期：2025-05-13

类型：发明专利

摘要

本发明公开了一种基于轻量级样本数据的文本分类方法及装置。其中，该方法包括：在接收到待分类文本的情况下，按照语义对待分类文本进行分割，得到多个词向量；对至少两个相邻的词向量依次进行局部特征关联分析，得到待分类文本的多个局部特征；根据所有词向量之间的语义关联对每个词向量进行全局特征关联分析，得到与每个词向量对应的全局特征；将多个局部特征和多个全局特征输入至文本分类模型中进行处理，得到待分类文本的文本类型。本发明解决了相关技术中传统的文本分类模型在训练时仍然需要收集大量的训练数据并人工标记标签，导致训练成本较高的技术问题。

技术关键词

特征关联分析文本分类模型文本分类方法样本分词语义数据双向长短期记忆网络文本分类装置多头注意力机制局部特征提取可读存储介质特征提取器编码人工标记计算机程序产品字符

系统为您推荐了相关专利信息

基于云雷达的降水预警及分类方法

回波特征参量单体模糊逻辑算法分类方法

问答处理方法、大模型训练方法、装置、设备及存储介质

模型训练方法样本模块种子模型训练装置

基于序列标注的网页正文定位方法、装置和计算机设备

HMM模型标签网页正文转移概率矩阵维特比算法

一种智慧工地大模型工作系统及方法

工作系统数据分析模块自然语言评价算法设备运行数据

一种垂直领域术语提取的方法、装置、设备和介质

文本分词语义相关度术语提取技术大语言模型

基于轻量级样本数据的文本分类方法及装置

站点导航

APP 下载