摘要
本发明公开了一种加速机器学习训练的方法,包括以下步骤:S1、数据收集,收集AI训练数据样本点;S2、旧模型辅助清洗数据,通过旧模型对数据集进行预测,对错误标签或异常数据样本进行识别和排出;S3、旧模型辅助生成伪标签,根据旧模型特征辅助生成数据信息伪标签;S4、数据增强,结合Grad‑CAM++方法分析数据分类重要性;S5、模型训练。本发明利用旧模型知识辅助生成伪标签,减少了对大量数据进行标记的需求,节省计算资源和计算时间,提高了标签准确性,避免了使用大量相似数据导致的过拟合问题,避免了模型在训练集上表现得过于优秀,但在新的、未见过的数据上表现不好,显著提高了模型泛化能力,提高了AI模型训练的高效性和准确性。
技术关键词
机器学习训练
标签
数据分类
生成热力图
异常数据
聚类
可视化方法
深度神经网络
样本
关注点
标记
关键点
决策
系统为您推荐了相关专利信息
弥散加权图像
颅骨剥离方法
二值掩码图像
多标签图像
填充算法
健康状态估计方法
等效电路模型
锂电池组
皮尔逊相关系数
统计特征
逻辑回归模型
构建用户画像
分布式身份认证
校验方法
客户
数据监测方法
时间序列预测模型
数据采集控制系统
填海造陆
径向基函数神经网络
风险
计算机可读取存储介质
监督系统
关键词
分布式文件系统