摘要
本公开的实施例提供了一种数据集扩增方法及系统。应用于数据增强技术领域,所述方法包括:从真实样本集中生成数据空间和特征空间的扰动样本,以增强数据多样性。随后,通过生成器将随机噪声映射为训练样本,并借助判别器对样本进行判别,通过生成器和判别器的交替训练,不断提升生成样本的质量,直至收敛。训练完成后,生成器基于随机噪声生成扩增样本集。接着,在交替训练过程中确定收缩起点步数和训练步数,并根据混合公式将真实样本、扩增样本与混合样本集成多源增强数据集。本方案通过动态混合系数实现数据分布渐进逼近,优化生成样本与真实样本的流形对齐,增强模型在小样本、类别不平衡和复杂场景下的表现,确保生成样本质量高且适应性强。
技术关键词
样本
随机噪声
数据集扩增方法
多模态特征
预训练模型
传感器特征
标签
噪声数据
扩增系统
文本
数据分布
处理器通信
图像
模块
存储器
动态