摘要
本发明公开了一种基于人工智能的数据集均衡化训练方法,具体涉及人工智能技术领域;是通过采集目标数据集并通过特征提取和类别归类,形成初始类别特征矩阵;通过少数类密度估计与流形局部维数分析,生成特征塌缩风险指标与低维流形描述;根据特征塌缩风险指标,在少数类流形邻域生成候选样本集合;通过流形保持距离度量计算候选样本的偏离度,并剔除偏离度超过预设偏离度阈值的候选样本,得到合成样本集合;将合成样本集合与目标数据集融合,并基于类别重加权策略进行均衡化训练,显著降低了特征空间塌缩与类间混淆,提高了模型在不平衡数据下的识别精度和泛化性能。
技术关键词
样本
条件生成对抗网络
人工智能模型
加权损失函数
标签
生成特征
深度卷积神经网络模型
数据
邻域
协方差矩阵
指标
风险
列表
人工智能技术
估计算法
随机噪声
校正
度量
序列
系统为您推荐了相关专利信息
电池包充电方法
人工智能模型
荷电状态预测
充电策略
变异策略
课堂系统
媒体网关
个性化学习路径
音视频解码
沉浸式交互