基于大语言模型的少数类样本生成方法、系统及存储介质

AITNT
正文
推荐专利
基于大语言模型的少数类样本生成方法、系统及存储介质
申请号:CN202411964307
申请日期:2024-12-30
公开号:CN119917856A
公开日期:2025-05-02
类型:发明专利
摘要
本发明公开了一种基于大语言模型的少数类样本生成方法、系统及存储介质,所述方法包括:对情感数据进行预处理及分析,以确定少数类平台样本数据集及多数类平台样本数据集;确定多数类平台样本数据集对应的多数类样本数量;基于少数类样本放大倍率和多数类样本数量将少数类样本数据集输入至大语言模型,以生成少数类模型样本数据集;将少数类平台样本数据集和少数类模型样本数据集进行合并,以通过情感分类模型进行情感文本分类。本发明通过数据样本处理和少数样本数据生成,其中基于大语言模型的少数类样本合成部分采样逐步数据合成框架,通过动态优化合成少数类样本数据以高效地缩小样本数据分布差距,从而实现提高情感分类模型准确率。
技术关键词
大语言模型 情感分类模型 样本生成方法 训练样本数据 文本 标签 信息采集平台 训练样本集 生成程序 生成系统 数据分布 模块 标记 处理器 动态 框架
系统为您推荐了相关专利信息
1
基于多模态消息的人机对话处理方法、装置、设备及介质
消息 多模态 图像识别模型 生成智能 视频识别
2
实时录制视频中指定视频帧的实时渲染方法及相关装置
视频帧 渲染方法 序列 渲染单元 画面
3
一种基于AI的电商平台商品图文内容生成方法及系统
电商平台商品 偏好特征 内容生成方法 图文 智能算法
4
一种图结构优化和表征分离的多模态情感分析方法及系统
情感分析方法 时间序列信息 样本 文本 音频
5
模型数据存储系统及方法
数据存储系统 存储组件 数据存储方法 仿真数据 仿真程序
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号