一种数据集扩增方法及系统

AITNT
正文
推荐专利
一种数据集扩增方法及系统
申请号:CN202510933654
申请日期:2025-07-07
公开号:CN120997062A
公开日期:2025-11-21
类型:发明专利
摘要
本公开的实施例提供了一种数据集扩增方法及系统。应用于数据增强技术领域,所述方法包括:从真实样本集中生成数据空间和特征空间的扰动样本,以增强数据多样性。随后,通过生成器将随机噪声映射为训练样本,并借助判别器对样本进行判别,通过生成器和判别器的交替训练,不断提升生成样本的质量,直至收敛。训练完成后,生成器基于随机噪声生成扩增样本集。接着,在交替训练过程中确定收缩起点步数和训练步数,并根据混合公式将真实样本、扩增样本与混合样本集成多源增强数据集。本方案通过动态混合系数实现数据分布渐进逼近,优化生成样本与真实样本的流形对齐,增强模型在小样本、类别不平衡和复杂场景下的表现,确保生成样本质量高且适应性强。
技术关键词
样本 随机噪声 数据集扩增方法 多模态特征 预训练模型 传感器特征 标签 噪声数据 扩增系统 文本 数据分布 处理器通信 图像 模块 存储器 动态
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号