基于大语言模型的少数类样本生成方法、系统及存储介质

正文

推荐专利

申请号：CN202411964307

申请日期：2024-12-30

公开号：CN119917856A

公开日期：2025-05-02

类型：发明专利

摘要

本发明公开了一种基于大语言模型的少数类样本生成方法、系统及存储介质，所述方法包括：对情感数据进行预处理及分析，以确定少数类平台样本数据集及多数类平台样本数据集；确定多数类平台样本数据集对应的多数类样本数量；基于少数类样本放大倍率和多数类样本数量将少数类样本数据集输入至大语言模型，以生成少数类模型样本数据集；将少数类平台样本数据集和少数类模型样本数据集进行合并，以通过情感分类模型进行情感文本分类。本发明通过数据样本处理和少数样本数据生成，其中基于大语言模型的少数类样本合成部分采样逐步数据合成框架，通过动态优化合成少数类样本数据以高效地缩小样本数据分布差距，从而实现提高情感分类模型准确率。

技术关键词

大语言模型情感分类模型样本生成方法训练样本数据文本标签信息采集平台训练样本集生成程序生成系统数据分布模块标记处理器动态框架

系统为您推荐了相关专利信息

基于多模态消息的人机对话处理方法、装置、设备及介质

消息多模态图像识别模型生成智能视频识别

实时录制视频中指定视频帧的实时渲染方法及相关装置

视频帧渲染方法序列渲染单元画面

一种基于AI的电商平台商品图文内容生成方法及系统

电商平台商品偏好特征内容生成方法图文智能算法

一种图结构优化和表征分离的多模态情感分析方法及系统

情感分析方法时间序列信息样本文本音频

模型数据存储系统及方法

数据存储系统存储组件数据存储方法仿真数据仿真程序

基于大语言模型的少数类样本生成方法、系统及存储介质

站点导航

APP 下载