摘要
本发明公开了一种大豆油、蛋白质含量预测和其SNP分析方法及系统,方法包括获取大豆样本数据集;对预处理后的大豆样本数据集进行特征选择和维度筛选,以得到筛选后的第一数据集;对第一数据集进行编码,编码基于碱基维度引入权重,以得到编码数据;将编码数据输入至预测模型,对油含量及蛋白质含量进行预测;对预测模型进解释性分析,获取SNP位点对表型的影响数据。本发明通过结合LD分析、GWAS分析、SVR模型和SHAP解释性分析,实现了在高维小样本数据中对大豆油和蛋白质含量的精准预测,同时提升了模型的解释性和可操作性。不仅能够有效降低数据冗余,还能够识别出与目标表型显著相关的SNP位点,提高了对基因型与表型关系的理解能力。
技术关键词
分析方法
大豆油
计算机可执行指令
特征选择
位点
样本
混合线性模型
数据冗余
SVR模型
处理器
编码模块
分析模块
可读存储介质
存储器
电子设备
系统为您推荐了相关专利信息
数据分析方法
多阶段
高精度传感器
连续生产流程
贝叶斯神经网络
轻度认知障碍
静息态
深度学习模型
多任务
识别方法
特征选择算法
图像识别方法
图像识别模型
特征提取网络
计算机可读指令