摘要
本发明提供了一种文本多标签分类方法,包括步骤:将文本数据样本转化为包括表征向量的第一条目,表征向量通过向量表征模型生成,向量表征模型通过第一样本集实现预训练;基于文本数据样本的表征向量,根据向量相似度确定第一数据库中第一条目的至少一条相似条目,第一数据库通过第一样本集的各样本转化的条目所构建,条目包括表征向量和标签类别;通过分类模型对比第一条目和相似条目,将与第一条目为同类的相似条目确定为同类条目;以及统计同类条目的标签类别的频次,确定频次最高的N个标签类别为文本数据样本的类别。
技术关键词
多标签分类方法
标签类别
样本
条目
文本
多标签分类系统
大语言模型
三元组
计算机
生成向量
关键词
存储器
摘要
数据
指令
可读存储介质
处理器
线下
模板
系统为您推荐了相关专利信息
水表信息
协议匹配方法
关键字
修正传感器数据
字段