摘要
本发明公开了一种基于轻量级样本数据的文本分类方法及装置。其中,该方法包括:在接收到待分类文本的情况下,按照语义对待分类文本进行分割,得到多个词向量;对至少两个相邻的词向量依次进行局部特征关联分析,得到待分类文本的多个局部特征;根据所有词向量之间的语义关联对每个词向量进行全局特征关联分析,得到与每个词向量对应的全局特征;将多个局部特征和多个全局特征输入至文本分类模型中进行处理,得到待分类文本的文本类型。本发明解决了相关技术中传统的文本分类模型在训练时仍然需要收集大量的训练数据并人工标记标签,导致训练成本较高的技术问题。
技术关键词
特征关联分析
文本分类模型
文本分类方法
样本
分词
语义
数据
双向长短期记忆网络
文本分类装置
多头注意力机制
局部特征提取
可读存储介质
特征提取器
编码
人工标记
计算机程序产品
字符
系统为您推荐了相关专利信息
HMM模型
标签
网页正文
转移概率矩阵
维特比算法
工作系统
数据分析模块
自然语言
评价算法
设备运行数据