基于大语言模型增强轻量级文本分类数据生成方法及系统

AITNT
正文
推荐专利
基于大语言模型增强轻量级文本分类数据生成方法及系统
申请号:CN202510871557
申请日期:2025-06-26
公开号:CN120687617A
公开日期:2025-09-23
类型:发明专利
摘要
本发明涉及自然语言处理技术领域,具体涉及基于大语言模型增强轻量级文本分类数据生成方法及系统,该方法包括:获取原始文本数据集;构建大语言模型智能体交互接口;执行数据增强路径处理,生成增强数据集;执行外部知识路径处理,构建外部知识库;基于增强数据集或外部知识库,训练轻量级文本分类模型;输出训练后的轻量级文本分类模型。本发明通过数据增强路径和外部知识路径双路径并行处理,克服了传统数据增强方法可能导致的语义失真问题和轻量级模型知识缺乏问题;利用大语言模型的语义理解和知识生成能力,实现了文本数据的高质量增强和领域知识的自动获取;同时保持了模型的轻量化特性,适用于资源受限环境。
技术关键词
大语言模型 文本分类模型 智能体交互 文本特征向量 实体 数据生成方法 门控循环单元网络 知识生成能力 指令 列表 资源受限环境 断点续传功能 多尺度卷积核 数据生成系统 接口 退避策略 系统容错 模型训练模块
系统为您推荐了相关专利信息
1
多模式协同的离在线语音交互方法、系统、设备及介质
语音交互方法 多模式协同 数据 云端 文本
2
一种基于知识图谱的施工组织管理方法、设备和介质
组织管理方法 深度学习语言模型 实体 双向长短期记忆网络 监控施工现场
3
基于三元组检索增强的不完整性知识图谱问答方法和装置
知识图谱问答方法 三元组 编码器 生成框架 样本
4
基于知识图谱的知识交换方法及系统
三元组 实体 数据 文本 交换系统
5
一种优化小型模型中代码思维链生成的方法
大语言模型 资源受限环境 数据 训练语料库 分治策略
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号