一种基于BERT模型和KNN半监督学习的少样本文本分类方法

正文

推荐专利

申请号：CN202510681573

申请日期：2025-05-26

公开号：CN120910259A

公开日期：2025-11-07

类型：发明专利

摘要

本发明提出了一种基于BERT模型和KNN半监督学习的少样本文本分类方法，通过融合BERT注意力机制与K近邻算法KNN进行半监督学习，先利用初始的标注数据训练BertATT模型，依据模型的注意力分布对有标签与无标签样本进行高注意力Token的提取，重构语义空间增强样本表示能力，随后在伪标签生成阶段，引入KNN算法，在重构后的样本空间中，计算未标注样本与标注样本之间的距离，通过KNN投票机制为高置信度的未标注样本赋予伪标签，并将其加入训练集中参与后续训练；本方法在提升伪标注准确性的同时，逐步优化模型性能，实现对少量标注数据的高效利用，提升了模型训练的稳定性与泛化能力，降低了对初始标注样本质量的依赖性，具备较强的工程适用性与跨领域扩展性。

技术关键词

文本分类方法 BERT模型样本标签重构少量标注数据注意力机制损失函数优化半监督学习 KNN算法近邻算法度量语义特征关键性鲁棒性矩阵

系统为您推荐了相关专利信息

一种多模态大模型驱动的电路图生成SPICE网表方法

多模态电路多层次轨迹推理机制

一种基于惩罚补偿种群动态重构的置信规则库优化方法

置信规则库进化算法重构动态协方差矩阵

家庭关系的识别方法、装置、设备及计算机可读存储介质

神经网络模型计算机程序指令识别方法异构元素

种植信息处理方法、装置、电子设备以及存储介质

智能通信设备定位标签智慧农业监测系统高风险土壤湿度信息

一种基于制冷型红外相机非现场样本学习的可燃气体气云成像方法

红外相机成像方法气体泄漏检测气体浓度分布损失函数设计

一种基于BERT模型和KNN半监督学习的少样本文本分类方法

站点导航

APP 下载