摘要
本发明涉及自然语言处理技术领域,具体涉及基于大语言模型增强轻量级文本分类数据生成方法及系统,该方法包括:获取原始文本数据集;构建大语言模型智能体交互接口;执行数据增强路径处理,生成增强数据集;执行外部知识路径处理,构建外部知识库;基于增强数据集或外部知识库,训练轻量级文本分类模型;输出训练后的轻量级文本分类模型。本发明通过数据增强路径和外部知识路径双路径并行处理,克服了传统数据增强方法可能导致的语义失真问题和轻量级模型知识缺乏问题;利用大语言模型的语义理解和知识生成能力,实现了文本数据的高质量增强和领域知识的自动获取;同时保持了模型的轻量化特性,适用于资源受限环境。
技术关键词
大语言模型
文本分类模型
智能体交互
文本特征向量
实体
数据生成方法
门控循环单元网络
知识生成能力
指令
列表
资源受限环境
断点续传功能
多尺度卷积核
数据生成系统
接口
退避策略
系统容错
模型训练模块
系统为您推荐了相关专利信息
组织管理方法
深度学习语言模型
实体
双向长短期记忆网络
监控施工现场
大语言模型
资源受限环境
数据
训练语料库
分治策略