摘要
本发明公开了基于监督学习的数据识别方法和系统,具体涉及数据识别技术领域,用于解决现有监督学习方法在低频特征捕获及特征关联建模中的不足,通过从多个数据源采集训练数据并过滤不满足质量门槛的样本;通过维度约简算法对特征进行信息增益测度,筛选具有高信息增益的特征集合;利用关联规则算法生成稀疏特征组合集,提取关键低频特征及其交互关系;将低频特征集合输入梯度提升机进行监督训练,通过自适应加权策略强化低频特征影响;在训练过程中监测低频特征的梯度更新趋势及Shapley值分布,对异常特征调整加权策略以修正模型权重分配,提高了模型的泛化能力和预测精度,适用于复杂数据场景的特征识别和分析。
技术关键词
梯度提升机
数据识别方法
稀疏特征
关联规则算法
策略
数据识别系统
数据识别技术
过滤模块
监督学习方法
样本
云存储平台
门槛
更新模型参数
关系
数据采集设备
序列
存储特征
系统为您推荐了相关专利信息
电网仿真
识别方法
样本
电网量测信息
深度强化学习算法
冗余控制方法
冗余控制系统
多通道
仿真建模
训练集数据
融合情感特征
注意力机制
问答方法
标签
对话策略
交通调控方法
调控策略
高风险
交通流
车辆运行数据