摘要
本申请的实施例揭示了一种基于KNN检索增强的文本分类方法及装置、设备、介质。方法包括:构建函数f(·),响应于输入的训练集,利用所述函数f(·)将所述训练数据集的文本序列映射到固定长度向量表示形式,将所有文本序列的向量表示和对应的标签存储于训练数据集中;构建文本增强模块,利用所述文本增强模块对所述训练数据集进行增强得到增强后的训练数据集;构建K‑最近邻分类器,利用所述增强后的训练数据集对所述K‑最近邻分类器进行训练,以训练好的K‑最近邻分类器实现文本分类。本发明显著提高了多种深度学习模型(如CNN、LSTM、BERT和RoBERTa)在文本分类任务上的性能,同时无需额外训练即可利用训练数据集信息增强模型的泛化能力和分类准确性。
技术关键词
文本分类方法
分类器
序列
计算机可读指令
深度学习模型
标签
生成向量
同义词
训练集
模拟真实场景
文本分类装置
邻居
数据存储
模块
控制器
存储单元
超参数