摘要
本发明公开了一种基于FIML和DAE的农业种质资源数据自适应填充方法,首先,利用聚类辅助避免数据异常值对算法的影响,然后采用选择性过滤层用于识别高质量估算、接着采用集成框架将全信息最大似然性(FIML)与多对抗性自编码器(DAE)结合的方法(CFSM‑DAE)来提高估算精度。最后,我们在3种缺失数据机制(MAR、MCAR和MNAR)下对模拟数据和实际水稻种质资源数据集进行研究,将CFSM‑DAE方法与多种常用填充算法比较(FIML,DAE,KNN,RF,MICE);本发明充分利用观测数据,捕捉非线性关系,提高了填补结果的准确性和模型的鲁棒性,在不同缺失机制和缺失率下均表现出优越的填补效果,显著优于FIML DAE,KNN,RF,MICE常见的填补方法,在水稻种质资源缺失值填补中表现出显著优越性。
技术关键词
农业种质资源
填充方法
数据
水稻种质资源
样本
评价指标筛选
聚类算法
神经网络参数
填补方法
填充算法
掩码矩阵
变量
鲁棒性
编码向量
非线性
标签
机制
对抗性
系统为您推荐了相关专利信息
评估系统
有效性
数据收集模块
学习历史数据
模型训练模块
服务器
流量调度方法
客户端
计算机可读指令
调度算法
研判分析方法
深度优先搜索算法
分布式能源设备
拓扑图
有效性