摘要
本发明公开了一种基于大语言模型的少数类样本生成方法、系统及存储介质,所述方法包括:对情感数据进行预处理及分析,以确定少数类平台样本数据集及多数类平台样本数据集;确定多数类平台样本数据集对应的多数类样本数量;基于少数类样本放大倍率和多数类样本数量将少数类样本数据集输入至大语言模型,以生成少数类模型样本数据集;将少数类平台样本数据集和少数类模型样本数据集进行合并,以通过情感分类模型进行情感文本分类。本发明通过数据样本处理和少数样本数据生成,其中基于大语言模型的少数类样本合成部分采样逐步数据合成框架,通过动态优化合成少数类样本数据以高效地缩小样本数据分布差距,从而实现提高情感分类模型准确率。
技术关键词
大语言模型
情感分类模型
样本生成方法
训练样本数据
文本
标签
信息采集平台
训练样本集
生成程序
生成系统
数据分布
模块
标记
处理器
动态
框架
系统为您推荐了相关专利信息
电商平台商品
偏好特征
内容生成方法
图文
智能算法
数据存储系统
存储组件
数据存储方法
仿真数据
仿真程序