基于机器阅读理解的小样本多标签文本分类方法

正文

推荐专利

申请号：CN202510124764

申请日期：2025-01-26

公开号：CN120123506B

公开日期：2025-12-02

类型：发明专利

摘要

本发明涉及多标签文本分类技术领域，且公开了一种基于机器阅读理解的小样本多标签文本分类方法，包括以下步骤：首先，对多标签文本数据集进行预处理，统一格式并标注标签。接着，基于标签设计辅助问题并与文本实例结合，形成输入数据。使用RoBERTa模型作为联合编码器主干，学习文本与问题的语义相关性，并构建表征标签关系的标签图。通过特征融合，训练模型以最小化损失函数，并使用验证集进行超参数调优。最终，在测试集上评估模型性能，并与传统方法对比，验证其优势和组件贡献。通过将多标签文本分类向机器阅读理解的任务转化，有助于更好地捕捉文本与标签之间的语义相关性，显著提高了多标签文本分类的准确性。

技术关键词

机器阅读理解节点特征语义特征多标签文本分类编码器注意力样本标签特征训练语言模型数据令牌邻居均衡场景细粒度特征深度学习方法

系统为您推荐了相关专利信息

基于半监督分割模型的屋顶光伏潜力评估方法

潜力评估方法屋顶注意力光伏装机容量图像块

基于自监督学习与身体对齐的虚拟试衣系统及方法

虚拟试衣系统虚拟试衣方法平铺服装图像视频

基于物流运输的数据分析方法及系统

语义特征数据分析方法物流文本意图

基于建筑能耗模型的辅助医院空间设计方法及装置

空间设计方法能耗自然语言医院空间结构特征

一种基于多模态对比学习的分子文本联合理解与编辑方法

分子编辑方法多模态自然语言文本文本编码器

基于机器阅读理解的小样本多标签文本分类方法

站点导航

APP 下载