基于大语言模型增强轻量级文本分类数据生成方法及系统

正文

推荐专利

申请号：CN202510871557

申请日期：2025-06-26

公开号：CN120687617A

公开日期：2025-09-23

类型：发明专利

摘要

本发明涉及自然语言处理技术领域，具体涉及基于大语言模型增强轻量级文本分类数据生成方法及系统，该方法包括：获取原始文本数据集；构建大语言模型智能体交互接口；执行数据增强路径处理，生成增强数据集；执行外部知识路径处理，构建外部知识库；基于增强数据集或外部知识库，训练轻量级文本分类模型；输出训练后的轻量级文本分类模型。本发明通过数据增强路径和外部知识路径双路径并行处理，克服了传统数据增强方法可能导致的语义失真问题和轻量级模型知识缺乏问题；利用大语言模型的语义理解和知识生成能力，实现了文本数据的高质量增强和领域知识的自动获取；同时保持了模型的轻量化特性，适用于资源受限环境。

技术关键词

大语言模型文本分类模型智能体交互文本特征向量实体数据生成方法门控循环单元网络知识生成能力指令列表资源受限环境断点续传功能多尺度卷积核数据生成系统接口退避策略系统容错模型训练模块

系统为您推荐了相关专利信息

多模式协同的离在线语音交互方法、系统、设备及介质

语音交互方法多模式协同数据云端文本

一种基于知识图谱的施工组织管理方法、设备和介质

组织管理方法深度学习语言模型实体双向长短期记忆网络监控施工现场

基于三元组检索增强的不完整性知识图谱问答方法和装置

知识图谱问答方法三元组编码器生成框架样本

基于知识图谱的知识交换方法及系统

三元组实体数据文本交换系统

一种优化小型模型中代码思维链生成的方法

大语言模型资源受限环境数据训练语料库分治策略

基于大语言模型增强轻量级文本分类数据生成方法及系统

站点导航

APP 下载