用于文本分类的领域知识融合数据增强方法

AITNT
正文
推荐专利
用于文本分类的领域知识融合数据增强方法
申请号:CN202411803742
申请日期:2024-12-10
公开号:CN119646223B
公开日期:2025-07-22
类型:发明专利
摘要
本申请提供的用于文本分类的领域知识融合数据增强方法,涉及数据增强技术领域,连接目标领域文献库后根据文本分类任务从中提取构建基础语料库,定义数据增强提示词,将提示词和基础语料库输入数据增强大语言模型中进行数据增强生成增强语料库,构建指令数据集,采用低秩自适应技术对数据增强大语言模型进行融合反馈学习,根据优化后的模型获取优化后的增强语料库,进而获取分类结果,解决了无法有效结合领域知识进行深层次的文本数据增强,导致生成的样本在语义深度和领域适应性上不足的问题,达到了有效生成高质量、领域适应性强的文本样本,提高文本分类模型的准确性和泛化能力,增强生成数据的可用性的效果。
技术关键词
大语言模型 数据 矩阵 样本 文本分类模型 指令 基础 指标 表达式 种子 标签 语义 模块 风格 误差 参数
系统为您推荐了相关专利信息
1
一种多视角目标样本与场景图像生成方法
图像生成方法 多视角 蒙特卡罗方法 像素 摄像机
2
一种安全合规将企业碳信用资质纳入财务报表的系统
审核规则 合规性 国密算法加密 分布式数据库 网络验证数据
3
一种融合3D打印的血管芯片系统及操作方法
磁性阻抗传感器 血液循环模拟装置 芯片系统 循环系统 动力装置
4
基于元宇宙及数字孪生的船舶设备超声清洗方法
超声清洗方法 涡轮增压器 船舶设备 超声清洗机 扩展现实技术
5
一种基于MIKE的流凌期冰凌演进数值模型的构建方法
分子扩散系数 粒子 数值 方程 动力模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号