摘要
本发明属于生物特征识别技术领域,涉及一种适用于小样本高维度数据的稻瘟病致病基因识别方法,该方法对采集的数据进行处理,得到每个基因所对应样本的表达量,之后进行差异分析,识别出差异表达基因,并根据差异表达基因构建PPI网络,确定与稻瘟病相关的关键基因;最后构建CGAN‑SAE深度学习模型,利用确定的关键基因对CGAN模块进行训练,使CGAN模块能够生成与真实数据难以区分的模拟基因样本数据;再用模拟基因样本与真实样本对SAE模块进行训练,使SAE模块能够捕捉全局特征,最终提取到的特征通过PCA进一步处理,识别出稻瘟病感染过程中的核心基因。该方法解决了在样本数量少,维度高的水稻数据集中进行基因筛选的难题。
技术关键词
基因识别方法
差异表达基因
稻瘟病
样本
网络结构
深度学习模型
生物特征识别技术
随机噪声
模块
编码器
线性
解码器
重构误差
数据分布
成分分析
核心
注意力