用于文本分类的领域知识融合数据增强方法

正文

推荐专利

用于文本分类的领域知识融合数据增强方法

申请号：CN202411803742

申请日期：2024-12-10

公开号：CN119646223B

公开日期：2025-07-22

类型：发明专利

摘要

本申请提供的用于文本分类的领域知识融合数据增强方法，涉及数据增强技术领域，连接目标领域文献库后根据文本分类任务从中提取构建基础语料库，定义数据增强提示词，将提示词和基础语料库输入数据增强大语言模型中进行数据增强生成增强语料库，构建指令数据集，采用低秩自适应技术对数据增强大语言模型进行融合反馈学习，根据优化后的模型获取优化后的增强语料库，进而获取分类结果，解决了无法有效结合领域知识进行深层次的文本数据增强，导致生成的样本在语义深度和领域适应性上不足的问题，达到了有效生成高质量、领域适应性强的文本样本，提高文本分类模型的准确性和泛化能力，增强生成数据的可用性的效果。

技术关键词

大语言模型数据矩阵样本文本分类模型指令基础指标表达式种子标签语义模块风格误差参数

系统为您推荐了相关专利信息

一种多视角目标样本与场景图像生成方法

图像生成方法多视角蒙特卡罗方法像素摄像机

一种安全合规将企业碳信用资质纳入财务报表的系统

审核规则合规性国密算法加密分布式数据库网络验证数据

一种融合3D打印的血管芯片系统及操作方法

磁性阻抗传感器血液循环模拟装置芯片系统循环系统动力装置

基于元宇宙及数字孪生的船舶设备超声清洗方法

超声清洗方法涡轮增压器船舶设备超声清洗机扩展现实技术

一种基于MIKE的流凌期冰凌演进数值模型的构建方法

分子扩散系数粒子数值方程动力模块

用于文本分类的领域知识融合数据增强方法

站点导航

APP 下载