基于轻量级样本数据的文本分类方法及装置

AITNT
正文
推荐专利
基于轻量级样本数据的文本分类方法及装置
申请号:CN202510205243
申请日期:2025-02-24
公开号:CN119988613A
公开日期:2025-05-13
类型:发明专利
摘要
本发明公开了一种基于轻量级样本数据的文本分类方法及装置。其中,该方法包括:在接收到待分类文本的情况下,按照语义对待分类文本进行分割,得到多个词向量;对至少两个相邻的词向量依次进行局部特征关联分析,得到待分类文本的多个局部特征;根据所有词向量之间的语义关联对每个词向量进行全局特征关联分析,得到与每个词向量对应的全局特征;将多个局部特征和多个全局特征输入至文本分类模型中进行处理,得到待分类文本的文本类型。本发明解决了相关技术中传统的文本分类模型在训练时仍然需要收集大量的训练数据并人工标记标签,导致训练成本较高的技术问题。
技术关键词
特征关联分析 文本分类模型 文本分类方法 样本 分词 语义 数据 双向长短期记忆网络 文本分类装置 多头注意力机制 局部特征提取 可读存储介质 特征提取器 编码 人工标记 计算机程序产品 字符
系统为您推荐了相关专利信息
1
基于云雷达的降水预警及分类方法
回波 特征参量 单体 模糊逻辑算法 分类方法
2
问答处理方法、大模型训练方法、装置、设备及存储介质
模型训练方法 样本 模块 种子 模型训练装置
3
基于序列标注的网页正文定位方法、装置和计算机设备
HMM模型 标签 网页正文 转移概率矩阵 维特比算法
4
一种智慧工地大模型工作系统及方法
工作系统 数据分析模块 自然语言 评价算法 设备运行数据
5
一种垂直领域术语提取的方法、装置、设备和介质
文本 分词 语义相关度 术语提取技术 大语言模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号