一种文本多标签分类方法、系统及介质

正文

推荐专利

一种文本多标签分类方法、系统及介质

申请号：CN202510378524

申请日期：2025-03-27

公开号：CN120296598A

公开日期：2025-07-11

类型：发明专利

摘要

本发明提供了一种文本多标签分类方法，包括步骤：将文本数据样本转化为包括表征向量的第一条目，表征向量通过向量表征模型生成，向量表征模型通过第一样本集实现预训练；基于文本数据样本的表征向量，根据向量相似度确定第一数据库中第一条目的至少一条相似条目，第一数据库通过第一样本集的各样本转化的条目所构建，条目包括表征向量和标签类别；通过分类模型对比第一条目和相似条目，将与第一条目为同类的相似条目确定为同类条目；以及统计同类条目的标签类别的频次，确定频次最高的N个标签类别为文本数据样本的类别。

技术关键词

多标签分类方法标签类别样本条目文本多标签分类系统大语言模型三元组计算机生成向量关键词存储器摘要数据指令可读存储介质处理器线下模板

系统为您推荐了相关专利信息

一种恶意攻击特征的智能多维演化协同分析方法及设备

误差向量样本恶意软件检测重构误差编解码器

一种基于人工智能的水表协议匹配方法及系统

水表信息协议匹配方法关键字修正传感器数据字段

一种复合洪涝灾害的分布概率计算方法及系统

概率计算方法因子图谱样本预测模型训练

冷站功率控制方法、装置和电子设备

舒适度强化学习模型时间段功率控制方法基础

图像检索的方法、装置、电子设备及存储介质

语义向量检索对象轮廓结构转换文本数据

一种文本多标签分类方法、系统及介质

站点导航

APP 下载